Comprendere e regolare le unità di streaming di Stream Analytics

Informazioni sull'unità di streaming e sul nodo di streaming

Le unità di streaming rappresentano le risorse di calcolo che eseguono un processo di Analisi di flusso. Più alto è il numero di unità di streaming, maggiori sono le risorse di memoria e CPU allocate per il processo. Questa capacità consente di concentrarsi sulla logica di query, senza doversi preoccupare di gestire l'hardware, per eseguire il processo di Analisi di flusso nei tempi previsti.

Analisi di flusso di Azure supporta due strutture di unità di streaming: SU V1 (da deprecare) e SU V2 (scelta consigliata).

Il modello SU V1 è l'offerta originale di Azure Stream Analytics in cui 6 SUs corrispondono a un singolo nodo di streaming per un lavoro. I processi possono anche essere eseguiti con 1 e 3 unità di streaming e corrispondono ai nodi di streaming frazionari. Il ridimensionamento avviene in incrementi di 6 dopo le prime 6 SU, passando a 12, 18, 24 e così via, aggiungendo altri nodi di streaming che forniscono risorse di calcolo distribuite.

Il modello SU V2 (scelta consigliata) è una struttura semplificata con prezzi favorevoli per le stesse risorse di calcolo. Nel modello SU V2, 1 SU V2 corrisponde a un nodo di streaming per il processo. 2 SU V2s corrispondono a 2 nodi di streaming, da 3 a 3 e così via. I processi con 1/3 e 2/3 SU V2 sono anche disponibili con un nodo di streaming, ma con solo una frazione delle risorse di calcolo. I processi 1/3 e 2/3 SU V2 offrono un'opzione conveniente per i carichi di lavoro che richiedono una scalabilità inferiore.

La tabella seguente illustra la potenza di calcolo sottostante per le unità di streaming V1 e V2:

Per informazioni sui prezzi delle SU, visita la Azure Stream Analytics Pricing Page.

Informazioni sulle conversioni delle unità di streaming e quando si applicano

Il sistema converte automaticamente le unità di streaming dal livello API REST all'interfaccia utente (portale di Azure e Visual Studio Code). Questa conversione viene visualizzata anche nel log attività , in cui i valori delle unità di streaming sono diversi dai valori nell'interfaccia utente. Questo comportamento è predefinito. I campi dell'API REST sono limitati ai valori interi, ma i processi di Analisi di flusso supportano nodi frazionari (unità di streaming 1/3 e 2/3). L'interfaccia utente di Analisi di flusso di Azure visualizza i valori dei nodi come 1/3, 2/3, 1, 2, 3 e così via, mentre il back-end (log attività, livello API REST) visualizza gli stessi valori moltiplicati per 3, 7, 10, 20 e 30 rispettivamente.

Standard	Standard V2 (interfaccia utente)	Standard V2 (back-end, ad esempio log, API REST e così via)
1	1/3	3
3	2/3	7
6	1	10
12	2	20
18	3	30
...	...	...

Questa conversione comunica la stessa granularità ed elimina il separatore decimale a livello API per le unità di mantenimento delle scorte V2 (SKU). Questa conversione è automatica e non ha alcun impatto sulle prestazioni dell'attività.

Informazioni sull'utilizzo della memoria e sul consumo

Per ottenere l'elaborazione di flussi a bassa latenza, i processi di Analisi di flusso di Azure eseguono tutta l'elaborazione in memoria. Quando il lavoro esaurisce la memoria, il processo di streaming ha esito negativo. Di conseguenza, per un processo di produzione, è importante monitorare l'utilizzo delle risorse di un processo di streaming e assicurarsi che sia disponibile una risorsa sufficiente allocata per mantenere i processi in esecuzione 24/7.

La metrica di utilizzo in percentuale delle unità di streaming, da 0% a 100%, descrive l'utilizzo di memoria del carico di lavoro. Per un processo di streaming con footprint minimo, questa metrica è in genere compresa tra 10% e 20%. Se l'utilizzo della percentuale di SU è elevato (superiore all'80%) o se gli eventi di input si accumulano (anche con un percentuale bassa di SU utilizzata, poiché non mostra l'utilizzo del CPU), il carico di lavoro richiede probabilmente più risorse di calcolo, il che richiede un aumento del numero di unità di streaming. È consigliabile mantenere la metrica delle SU al di sotto dell'80% in modo da tenere conto dei picchi occasionali. Per reagire a carichi di lavoro aumentati e aumentare le unità di streaming, valutare la possibilità di impostare un avviso dell'80% sulla metrica Utilizzo delle SU. Inoltre, è possibile usare le metriche del ritardo del contrassegno temporale e degli eventi arretrati per verificare un eventuale impatto.

Configurare le unità di streaming (SUs) di Stream Analytics

Accedere al portale di Azure.
Nell'elenco delle risorse trovare il processo di Analisi di flusso da ridimensionare e aprirlo.
Nella pagina del processo di lavoro, sotto l'intestazione Configura, selezionare Ridimensiona. Il numero predefinito di SU è 1 quando si crea un processo.

Scegliere l'opzione SU nell'elenco a discesa per impostare le SU per il processo. Si è limitati a un intervallo di SU specifico.
È possibile modificare il numero di SU assegnate al processo mentre è in esecuzione. Potresti essere limitato a scegliere da un set di valori SU quando il processo è in esecuzione se il processo utilizza un output non partizionato o ha una query a più passaggi con diversi valori PARTITION BY.

Monitorare le prestazioni del lavoro

Usando il portale di Azure, è possibile tenere traccia delle metriche correlate alle prestazioni di un processo. Per altre informazioni sulla definizione delle metriche, vedere Metriche dei job di Azure Stream Analytics. Per altre informazioni sul monitoraggio delle metriche nel portale, vedere Monitorare il processo di Analisi di flusso con il portale di Azure.

Calcolare la velocità effettiva prevista del carico di lavoro. Se la velocità effettiva è inferiore al previsto, ottimizzare la partizione di input e la query, quindi aggiungere unità di streaming al processo.

Quante SUs sono necessarie per un lavoro?

Il numero di SU necessarie dipende dalla configurazione della partizione per gli input e dalla query definita all'interno del processo. La pagina Ridimensiona consente di impostare il numero corretto di unità di streaming. Allocare più SU di quanto si pensi possano essere necessarie. Il motore di elaborazione di Analisi di flusso ottimizza la latenza e la velocità effettiva al costo dell'allocazione di memoria aggiuntiva.

In generale, iniziare con 1 SU V2 per le query che non usano PARTITION BY. Trovare quindi il numero migliore per prova ed errore. Modificare il numero di SU dopo aver passato quantità rappresentative di dati ed esaminare la metrica di utilizzo SU%. Il numero massimo di unità di streaming che un processo di Analisi di flusso può usare dipende dal numero di passaggi nella query definita per il processo e dal numero di partizioni in ogni passaggio. Altre informazioni sui limiti sono disponibili qui.

Per ulteriori informazioni sulla scelta del numero corretto di Streaming Units (SUs), consulta la pagina Ridimensionare i processi di analisi di flusso di Azure per aumentare la velocità effettiva.

Nota

Il numero di UR necessarie per un processo dipende dalla configurazione della partizione per gli input e dalla query definita per il processo. È prevista una quota massima di unità di streaming che è possibile selezionare per un processo. Per informazioni sulla quota di sottoscrizione di Analisi di flusso di Azure, vedere Limiti di Analisi di flusso. Per aumentare le SU per le sottoscrizioni oltre questa quota, contattare il supporto tecnico Microsoft. I valori validi per SU per processo sono 1/3, 2/3, 1, 2, 3 e così via.

Fattori che determinano un maggiore utilizzo SU%

Gli elementi di query temporali costituiscono il set principale degli operatori con stato forniti da Analisi di flusso. Analisi di flusso gestisce lo stato di queste operazioni internamente per conto dell'utente. Gestisce l'utilizzo della memoria, il checkpoint per la resilienza e il ripristino dello stato durante gli aggiornamenti del servizio. Anche se Stream Analytics gestisce completamente gli stati, si consiglia di considerare molte raccomandazioni sulle procedure consigliate.

Un processo con logica di query complessa può registrare un utilizzo SU% elevato, anche quando non riceve eventi di input in modo continuo. Può verificarsi dopo un picco improvviso negli eventi di input e output. Se la query è complessa, il processo potrebbe continuare a mantenere lo stato in memoria.

Gli errori temporanei o gli aggiornamenti avviati dal sistema possono causare un calo improvviso dell'utilizzo di su% a 0 per un breve periodo prima di tornare ai livelli previsti. L'aumento del numero di unità di streaming per un processo potrebbe non ridurre l'utilizzo SU% se la query non è completamente parallela.

Quando si confronta l'utilizzo in un periodo di tempo, usare le metriche della frequenza degli eventi. Le metriche InputEvents e OutputEvents mostrano il numero di eventi letti ed elaborati. Le metriche, ad esempio gli errori di deserializzazione, indicano il numero di eventi di errore. Quando il numero di eventi per unità di tempo aumenta, la percentuale di SU nella maggior parte dei casi aumenta.

Logica di query con stato negli elementi temporali

Una delle funzionalità esclusive dei processi di Analisi di flusso di Azure è l'elaborazione con stato, ad esempio aggregazioni finestrate, join temporali e funzioni analitiche temporali. Ognuno di questi operatori mantiene le informazioni sullo stato. La dimensione massima della finestra temporale per questi elementi di query è sette giorni.

Il concetto di finestra temporale è presente in diversi elementi di query di Analisi di flusso:

Aggregazioni basate su finestre: GROUP BY finestre a cascata, di salto e finestre temporali scorrevoli
Join temporali: JOIN con funzione DATEDIFF.
Funzioni analitiche temporali: ISFIRST, LASTe LAG con LIMIT DURATION

I fattori seguenti influiscono sulla memoria usata (parte della metrica di unità di streaming) dai processi di Analisi di flusso:

Funzioni di aggregazione finestra

La memoria consumata (dimensione dello stato) per un aggregato a finestre non è sempre direttamente proporzionale alla dimensione della finestra. La memoria consumata è invece proporzionale alla cardinalità dei dati o al numero di gruppi in ogni finestra temporale.

Ad esempio, nella query seguente il numero associato a clusterid è la cardinalità della query.

SELECT count(*)
FROM input 
GROUP BY  clusterid, tumblingwindow (minutes, 5)

Per attenuare i problemi causati da cardinalità elevata nella query precedente, inviare eventi agli Hub eventi partizionati da clusterid. Aumentare il numero di istanze della query consentendo al sistema di elaborare ogni partizione di input separatamente usando PARTITION BY , come illustrato nell'esempio seguente:

SELECT count(*) 
FROM input PARTITION BY PartitionId
GROUP BY PartitionId, clusterid, tumblingwindow (minutes, 5)

Una volta partizionata, la query viene distribuita su più nodi. Di conseguenza, il numero di clusterid valori che arrivano in ogni nodo viene ridotto, riducendo la cardinalità dell'operatore GROUP BY .

Partiziona Event Hubs in base alla chiave di raggruppamento per evitare la necessità di un passaggio di riduzione. Per altre informazioni, vedere Panoramica di Hub eventi.

Join temporali

La memoria utilizzata (dimensione dello stato) da un join temporale è proporzionale al numero di eventi nel margine temporale del join. Questo numero è uguale al tasso di input dell'evento moltiplicato per il margine di flessibilità. In altre parole, la memoria utilizzata dai join è proporzionale all'intervallo di tempo DateDiff moltiplicato per la frequenza media degli eventi.

Il numero di eventi non corrispondenti nel join influisce sull'utilizzo della memoria per la query. La query seguente cerca le impressioni degli annunci che generano clic:

SELECT clicks.id
FROM clicks 
INNER JOIN impressions ON impressions.id = clicks.id AND DATEDIFF(hour, impressions, clicks) between 0 AND 10.

In questo esempio, è possibile che vengano visualizzati molti annunci e pochi clic su di essi. È necessario mantenere tutti gli eventi nell'intervallo di tempo. La memoria consumata è proporzionale alle dimensioni della finestra e alla frequenza degli eventi.

Per correggere questo comportamento, inviare eventi a Hub eventi partizionati dalle chiavi di join (ID in questo caso) e aumentare il numero di istanze della query consentendo al sistema di elaborare ogni partizione di input separatamente usando PARTITION BY , come illustrato di seguito:

SELECT clicks.id
FROM clicks PARTITION BY PartitionId
INNER JOIN impressions PARTITION BY PartitionId 
ON impression.PartitionId = clicks.PartitionId AND impressions.id = clicks.id AND DATEDIFF(hour, impressions, clicks) between 0 AND 10

Dopo aver partizionato la query, è possibile distribuirla su più nodi. Di conseguenza, si riduce il numero di eventi che arrivano in ogni nodo e si riducono le dimensioni dello stato mantenuto nella finestra di join.

Funzioni di analisi temporale

La memoria utilizzata (dimensioni dello stato) da una funzione analitica temporale è proporzionale alla frequenza degli eventi moltiplicata per la durata. La memoria utilizzata dalle funzioni analitiche non è proporzionale alle dimensioni della finestra, ma piuttosto al numero di partizioni in ogni intervallo di tempo.

La correzione è simile a quella per il join temporale. È possibile aumentare il numero di istanze della query usando PARTITION BY.

Buffer non in ordine

È possibile configurare le dimensioni del buffer non in ordine nel riquadro configurazione Ordinamento eventi. Il buffer contiene gli input per la durata della finestra e li riordina. Le dimensioni del buffer sono proporzionali alla frequenza di input dell'evento moltiplicata per le dimensioni della finestra non in ordine. La dimensione predefinita della finestra è 0.

Per correggere l'overflow del buffer non in ordine, aumentare il numero di istanze per la query usando PARTITION BY. Dopo essere stata suddivisa, la query viene distribuita su più nodi. Di conseguenza, il numero di eventi in arrivo in ogni nodo diminuisce, riducendo a sua volta il numero di eventi in ogni buffer di riordinamento.

Conteggio delle partizioni di input

Ogni partizione di input del job ha un buffer. Maggiore è il numero di partizioni di input, maggiore è il numero di risorse utilizzate dal processo. Per ogni unità di streaming, Analisi di flusso di Azure può elaborare circa 7 MB di input al secondo. È pertanto possibile ottimizzare abbinando il numero di unità di streaming di Analisi di flusso al numero di partizioni nell'hub eventi.

In genere, un processo configurato con un'unità di streaming pari a un terzo è sufficiente per un hub eventi con due partizioni, ovvero il minimo per l'hub eventi. Se l'hub eventi ha più partizioni, il processo di Analisi di flusso usa più risorse, ma non usa necessariamente la velocità effettiva aggiuntiva fornita da Hub eventi.

Per un processo con un'unità di streaming V2, potrebbero essere necessarie 4 o 8 partizioni dall'hub eventi. Tuttavia, evitare troppe partizioni non necessarie perché causano un utilizzo eccessivo delle risorse. Ad esempio, un hub eventi con 16 o più partizioni in un job di Analisi di flusso che utilizza una sola unità di streaming.

Dati di riferimento

Analisi di flusso di Azure carica i dati di riferimento in memoria per una ricerca rapida. Con l'implementazione corrente ogni operazione di join con dati di riferimento mantiene una copia dei dati di riferimento in memoria, anche se il join viene eseguito con gli stessi dati di riferimento più volte. Per le query con PARTITION BY, ogni partizione include una copia dei dati di riferimento, in modo che le partizioni siano completamente separate. Con l'effetto moltiplicatore l'utilizzo della memoria può aumentare rapidamente se si esegue il join con i dati di riferimento più volte con più partizioni.

Uso di funzioni definite dall'utente

Quando si aggiunge una funzione UDF, Azure Stream Analytics carica l'ambiente JavaScript in memoria, il che influisce sull'SU%.

Passaggi successivi

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-02-24