Condividi tramite


Modello di risorse di Analisi di flusso di Azure

Analisi di flusso di Azure è una piattaforma distribuita come servizio (PaaS) completamente gestita per l'elaborazione dei flussi. Questo articolo descrive il modello di risorsa per Analisi di flusso introducendo il concetto di cluster di Analisi di flusso, processo e componenti di un processo.

Processo di Analisi di flusso

Un processo di Analisi di flusso è l'unità fondamentale di Analisi di flusso che consente di definire ed eseguire la logica di elaborazione del flusso. Un processo è costituito da 3 componenti principali:

  • Input
  • Output
  • Query

Input

Un processo può avere uno o più input da cui leggere continuamente i dati. Queste origini dati di input di streaming possono essere una Hub eventi di Azure, hub IoT di Azure o Archiviazione di Azure. Analisi di flusso supporta anche la lettura di dati di input statici o a modifica lenta (denominati dati di riferimento), spesso usati per arricchire i dati di streaming. L'aggiunta di questi input al processo è un'operazione senza codice.

Output

Un processo può avere uno o più output in cui scrivere dati in modo continuo. Analisi di flusso supporta 12 sink di output diversi, tra cui database SQL di Azure, Azure Data Lake Archiviazione, Azure Cosmos DB, Power BI e altro ancora. L'aggiunta di questi output al processo è anche un'operazione senza codice.

Query

È possibile implementare la logica di elaborazione del flusso scrivendo una query SQL nel processo. Il supporto avanzato del linguaggio SQL consente di affrontare scenari come l'analisi di json complessi, i valori di filtro, l'elaborazione di aggregazioni, l'esecuzione di join e casi d'uso ancora più avanzati, ad esempio l'analisi geospaziale e il rilevamento delle anomalie. È anche possibile estendere questo linguaggio SQL con funzioni definite dall'utente JavaScript e aggregazioni definite dall'utente. Analisi di flusso consente anche di regolare facilmente gli eventi in ritardo e non in ordine tramite configurazioni semplici nelle impostazioni del processo. È anche possibile scegliere di eseguire la query in base all'ora di arrivo dell'evento di input nell'origine di input o quando l'evento è stato generato nell'origine evento.

Esecuzione di un processo

Dopo aver sviluppato il processo configurando input, output e query, è possibile avviare il processo specificando il numero di unità di streaming. Dopo l'avvio del processo, passa a uno stato In esecuzione e rimarrà in tale stato fino a quando non viene arrestato in modo esplicito o si verifica un errore irreversibile. Quando il processo è in esecuzione, esegue continuamente il pull dei dati dalle origini di input, esegue la logica di query che produce risultati che vengono scritti nei sink di output con latenza end-to-end in millisecondi.

All'avvio del processo, il servizio Analisi di flusso si occupa della compilazione della query e assegna una certa quantità di calcolo e memoria in base al numero di unità di streaming configurate nel processo. Non è necessario preoccuparsi di un'infrastruttura sottostante come manutenzione del cluster, le patch di sicurezza in quanto vengono eseguite automaticamente dalla piattaforma. Quando si eseguono processi nello SKU Standard, vengono addebitati i costi per le unità di streaming solo quando viene eseguito il processo.

Cluster di analisi di flusso

Per impostazione predefinita, i processi di Analisi di flusso vengono eseguiti nell'ambiente multi-tenant Standard che costituisce lo SKU Standard. Analisi di flusso offre anche uno SKU dedicato in cui è possibile effettuare il provisioning di un intero cluster di Analisi di flusso appartenente all'utente. In questo modo è possibile controllare completamente i processi eseguiti nel cluster. Le dimensioni minime di un cluster di Analisi di flusso sono pari a 12 unità di streaming e vengono addebitate le spese per l'intera capacità del cluster da quando viene effettuato il provisioning. Altre informazioni sui vantaggi dei cluster di Analisi di flusso e su quando usarli.

Diagram that shows Standard multi-tenant environment in Stream Analytics.

Diagram that shows Dedicated environment in Stream Analytics.

Passaggi successivi

Informazioni su come gestire Analisi di flusso di Azure e altri concetti: