Flussi di dati di streaming (anteprima)

Le organizzazioni vogliono lavorare con i dati in quanto vengono inseriti, non giorni o settimane dopo. La visione di Power BI è semplice: le distinzioni tra batch, in tempo reale e streaming dovrebbero scomparire. Gli utenti devono essere in grado di lavorare con tutti i dati non appena sono disponibili.

Importante

I flussi di dati di streaming sono stati ritirati e non sono più disponibili. Analisi di flusso di Azure ha unito la funzionalità dei flussi di dati di streaming. Per altre informazioni sul ritiro dei flussi di dati di streaming, vedere l'annuncio di ritiro.

Gli analisti hanno in genere bisogno di assistenza tecnica per gestire le origini dati di streaming, la preparazione dei dati, le operazioni complesse basate sul tempo e la visualizzazione dei dati in tempo reale. I reparti IT spesso si basano su sistemi personalizzati e una combinazione di tecnologie di vari fornitori, per eseguire analisi tempestive sui dati. Senza questa complessità, non possono fornire ai decision maker informazioni quasi in tempo reale.

I flussi di dati di streaming consentono agli autori di connettersi, inserire, eseguire il mash up, il modello e creare report basati sullo streaming in dati quasi in tempo reale direttamente nella servizio Power BI. Il servizio abilita esperienze di trascinamento della selezione senza codice.

È possibile combinare e associare i dati di streaming ai dati batch se è necessario tramite un'interfaccia utente che include una visualizzazione diagramma per semplificare il mashup dei dati. L'elemento finale prodotto è un flusso di dati, che può essere utilizzato in tempo reale per creare report altamente interattivi e quasi in tempo reale. Tutte le funzionalità di visualizzazione dei dati in Power BI funzionano con i dati di streaming, proprio come avvieni con i dati batch.

Diagram showing an example of mixed streaming and batch data in a simple workflow that creates real-time reports in Power BI.

Gli utenti possono eseguire operazioni di preparazione dei dati come join e filtri. Possono anche eseguire aggregazioni temporali (ad esempio finestre a cascata, salto e sessione) per operazioni di raggruppamento.

I flussi di dati in streaming in Power BI consentono alle organizzazioni di:

  • Prendere decisioni sicure quasi in tempo reale. Le organizzazioni possono essere più agili e intraprendere azioni significative in base alle informazioni dettagliate più aggiornate.
  • Democratizzare i dati di streaming. Le organizzazioni possono rendere i dati più accessibili e più facili da interpretare con una soluzione senza codice e questa accessibilità riduce le risorse IT.
  • Accelerare il tempo per ottenere informazioni dettagliate usando una soluzione di analisi di streaming end-to-end con l'archiviazione dei dati integrata e la business intelligence.

I flussi di dati di streaming supportano DirectQuery e il rilevamento automatico delle modifiche/aggiornamento pagina. Questo supporto consente agli utenti di creare report che vengono aggiornati quasi in tempo reale, fino a ogni secondo, usando qualsiasi oggetto visivo disponibile in Power BI.

Requisiti

Prima di creare il primo flusso di dati di streaming, assicurarsi di soddisfare tutti i requisiti seguenti:

  • Per creare ed eseguire un flusso di dati di streaming, è necessaria un'area di lavoro che fa parte di una licenza premium di capacità o Premium per utente (PPU).

    Importante

    Se si usa una licenza PPU e si vuole che altri utenti usino i report creati con flussi di dati di streaming aggiornati in tempo reale, è necessaria anche una licenza PPU. Possono quindi utilizzare i report con la stessa frequenza di aggiornamento configurata, se tale aggiornamento è più veloce di ogni 30 minuti.

  • Abilitare i flussi di dati per il tenant. Per altre informazioni, vedere Abilitazione dei flussi di dati in Power BI Premium.

  • Per assicurarsi che i flussi di dati di streaming funzionino nella capacità Premium, è necessario attivare il motore di calcolo avanzato. Il motore è attivato per impostazione predefinita, ma gli amministratori della capacità di Power BI possono disattivarlo. In tal caso, contattare l'amministratore per attivarlo.

    Il motore di calcolo avanzato è disponibile solo nelle capacità Premium P o Embedded A3 e di dimensioni maggiori. Per usare flussi di dati di streaming, è necessaria una capacità PPU Premium di qualsiasi dimensione o una capacità embedded A3 o superiore. Per altre informazioni sugli SKU Premium e sulle relative specifiche, vedere Capacità e SKU nell'analisi incorporata di Power BI.

  • Per creare report aggiornati in tempo reale, assicurarsi che l'amministratore (capacità o Power BI per PPU) abbia abilitato l'aggiornamento automatico della pagina. Assicurarsi anche che l'amministratore abbia consentito un intervallo di aggiornamento minimo che soddisfi le proprie esigenze. Per altre informazioni, vedere Aggiornamento pagina automatico in Power BI.

Creare un flusso di dati di streaming

Un flusso di dati, come il relativo flusso di dati, è una raccolta di entità (tabelle) create e gestite nelle aree di lavoro nel servizio Power BI. Una tabella è un set di campi usati per archiviare i dati, in modo analogo a una tabella all'interno di un database.

È possibile aggiungere e modificare tabelle nel flusso di dati di streaming direttamente dall'area di lavoro in cui è stato creato il flusso di dati. La differenza principale con i flussi di dati regolari è che non è necessario preoccuparsi degli aggiornamenti o della frequenza. A causa della natura dei dati di streaming, è presente un flusso continuo in arrivo. L'aggiornamento è costante o infinito, a meno che non venga interrotto.

Nota

È possibile avere un solo tipo di flusso di dati per area di lavoro. Se si dispone già di un flusso di dati regolare nell'area di lavoro Premium, non sarà possibile creare un flusso di dati di streaming (e viceversa).

Per creare un flusso di dati di streaming:

  1. Aprire il servizio Power BI in un browser e quindi selezionare un'area di lavoro abilitata per Premium. I flussi di dati in streaming, ad esempio i flussi di dati normali, non sono disponibili in Area di lavoro personale.

  2. Selezionare il menu a discesa Nuovo e quindi scegliere Flusso di dati in streaming.

    Screenshot that shows the New menu options with streaming dataflow highlighted.

  3. Nel riquadro laterale visualizzato è necessario denominare il flusso di dati di streaming. Immettere un nome nella casella Nome (1) e quindi selezionare Crea (2).

    Screenshot of the new streaming dataflow pane with name and create highlighted.

    Viene visualizzata la visualizzazione diagramma vuota per i flussi di dati di streaming.

Lo screenshot seguente mostra un flusso di dati completato. Evidenzia tutte le sezioni disponibili per la creazione nell'interfaccia utente del flusso di dati.

Screenshot of an example dataflow window with the ribbon, diagram view, side pane, and tabs highlighted.

  1. Barra multifunzione: sulla barra multifunzione, le sezioni seguono l'ordine di un processo di analisi "classico": input (noti anche come origini dati), trasformazioni (operazioni ETL in streaming), output e un pulsante per salvare lo stato di avanzamento.

  2. Visualizzazione diagramma: questa visualizzazione è una rappresentazione grafica del flusso di dati, dagli input alle operazioni agli output.

  3. Riquadro laterale: a seconda del componente selezionato nella visualizzazione diagramma, sono disponibili impostazioni per modificare ogni input, trasformazione o output.

  4. Schede per l'anteprima dei dati, la creazione di errori e gli errori di runtime: per ogni scheda visualizzata, l'anteprima dei dati mostra i risultati per tale passaggio (live per gli input e gli output su richiesta per trasformazioni e output).

    Questa sezione riepiloga anche eventuali errori o avvisi di creazione presenti nei flussi di dati. Selezionando ogni errore o avviso viene selezionata la trasformazione. Inoltre, è possibile accedere agli errori di runtime dopo l'esecuzione del flusso di dati, ad esempio i messaggi eliminati.

    È sempre possibile ridurre al minimo questa sezione dei flussi di dati di streaming selezionando la freccia nell'angolo superiore destro.

Un flusso di dati è basato su tre componenti principali: input di streaming, trasformazioni e output. È possibile avere tutti i componenti desiderati, inclusi più input, rami paralleli con più trasformazioni e più output.

Aggiungere un input di streaming

Per aggiungere un input di streaming, selezionare l'icona sulla barra multifunzione e fornire le informazioni necessarie nel riquadro laterale per configurarla. A partire da luglio 2021, l'anteprima dei flussi di dati di streaming supporta Hub eventi di Azure e hub IoT di Azure come input.

I servizi Hub eventi di Azure e hub IoT di Azure sono basati su un'architettura comune per facilitare l'inserimento e l'utilizzo rapidi e scalabili degli eventi. hub IoT in particolare è personalizzato come hub messaggi centrale per le comunicazioni in entrambe le direzioni tra un'applicazione IoT e i relativi dispositivi collegati.

Hub eventi di Azure

Hub eventi di Azure è una piattaforma di streaming di Big Data e un servizio di inserimento di eventi. È in grado di ricevere ed elaborare milioni di eventi al secondo. I dati inviati a un hub eventi possono essere trasformati e archiviati usando qualsiasi provider di analisi in tempo reale oppure è possibile usare l'invio in batch o gli adattatori di archiviazione.

Per configurare un hub eventi come input per i flussi di dati di streaming, selezionare l'icona dell'hub eventi. Nella visualizzazione diagramma viene visualizzata una scheda, incluso un riquadro laterale per la configurazione.

Screenshot that shows the event hub card and configuration pane in diagram view.

È possibile incollare l'stringa di connessione di Hub eventi. I flussi di dati di streaming compilano tutte le informazioni necessarie, incluso il gruppo di consumer facoltativo (che per impostazione predefinita è $Default). Se si desidera immettere manualmente tutti i campi, è possibile attivare l'interruttore di immissione manuale per visualizzarli. Per altre informazioni, vedere Ottenere un stringa di connessione di Hub eventi.

Dopo aver configurato le credenziali di Hub eventi e aver selezionato Connessione, è possibile aggiungere manualmente i campi usando + Aggiungi campo se si conoscono i nomi dei campi. In alternativa, è possibile rilevare automaticamente campi e tipi di dati in base a un campione dei messaggi in arrivo, selezionare Campi di rilevamento automatico. Se necessario, la selezione dell'icona a forma di ingranaggio consente di modificare le credenziali.

Screenshot that shows input data options, EntryTime is selected with the more options tool tip displayed.

Quando i flussi di dati di streaming rilevano i campi, è possibile visualizzarli nell'elenco. È disponibile anche un'anteprima in tempo reale dei messaggi in arrivo nella tabella Anteprima dati nella visualizzazione diagramma.

È sempre possibile modificare i nomi dei campi o rimuovere o modificare il tipo di dati selezionando altre opzioni (...) accanto a ogni campo. È anche possibile espandere, selezionare e modificare i campi annidati dai messaggi in arrivo, come illustrato nell'immagine seguente.

Screenshot that shows remove, rename and data type options for input data.

Hub IoT di Azure

hub IoT è un servizio gestito ospitato nel cloud. Funge da hub messaggi centrale per le comunicazioni in entrambe le direzioni tra un'applicazione IoT e i relativi dispositivi collegati. È possibile connettere milioni di dispositivi e soluzioni back-end in modo affidabile e sicuro. Quasi tutti i dispositivi possono essere connessi a un hub IoT.

hub IoT configurazione è simile alla configurazione di Hub eventi a causa dell'architettura comune. Esistono tuttavia alcune differenze, tra cui la posizione in cui trovare le stringa di connessione compatibili con Hub eventi per l'endpoint predefinito. Per altre informazioni, vedere Leggere i messaggi da dispositivo a cloud dall'endpoint predefinito.

 Screenshot that shows the IOT Hub card and configuration pane in diagram view

Dopo aver incollato il stringa di connessione per l'endpoint predefinito, tutte le funzionalità per la selezione, l'aggiunta, l'individuazione automatica e la modifica dei campi provenienti da hub IoT sono uguali a quelli di Hub eventi. È anche possibile modificare le credenziali selezionando l'icona a forma di ingranaggio.

Suggerimento

Se si ha accesso a Hub eventi o hub IoT nell'portale di Azure dell'organizzazione e si vuole usarlo come input per il flusso di dati di streaming, è possibile trovare i stringa di connessione nelle posizioni seguenti:

Per Hub eventi:

  1. Nella sezione Analisi selezionare Tutti i servizi>di Hub eventi.
  2. Selezionare Entità dello spazio dei nomi>/Hub eventi di Hub eventi e quindi selezionare il nome dell'hub eventi.
  3. Nell'elenco Criteri di accesso condiviso selezionare un criterio.
  4. Selezionare Copia negli Appunti accanto al campo stringa-chiave primaria di Connessione ion.

Per hub IoT:

  1. Nella sezione Internet delle cose selezionare Tutti i servizi> hub IoT s.
  2. Selezionare l'hub IoT a cui connettersi e quindi selezionare Endpoint predefiniti.
  3. Selezionare Copia negli Appunti accanto all'endpoint compatibile con Hub eventi.

Quando si usano i dati di flusso da Hub eventi o hub IoT, è possibile accedere ai campi dell'ora dei metadati seguenti nel flusso di dati di streaming:

  • EventProcessedUtcTime: data e ora di elaborazione dell'evento.
  • EventEnqueuedUtcTime: data e ora di ricezione dell'evento.

Nessuno di questi campi viene visualizzato nell'anteprima di input. È necessario aggiungerli manualmente.

Archiviazione BLOB

L'archivio BLOB di Azure è la soluzione di archiviazione di oggetti Microsoft per il cloud. L'archiviazione BLOB è ottimizzata per l'archiviazione di grandi quantità di dati non strutturati. I dati non strutturati sono dati che non seguono una definizione o un modello di dati specifico, ad esempio dati di testo o binari.

È possibile usare BLOB di Azure come input di streaming o riferimento. I BLOB di streaming vengono controllati ogni secondo per gli aggiornamenti. A differenza di un BLOB di streaming, un BLOB di riferimento viene caricato solo all'inizio dell'aggiornamento. Si tratta di dati statici che non devono essere modificati e il limite consigliato per i dati statici è di 50 MB o inferiore.

Power BI prevede l'uso di BLOB di riferimento insieme alle origini di streaming, ad esempio tramite join. Di conseguenza, un flusso di dati di streaming con un BLOB di riferimento deve avere anche un'origine di streaming.

La configurazione per i BLOB di Azure è leggermente diversa da quella di un nodo Hub eventi di Azure. Per trovare l'stringa di connessione BLOB di Azure, vedere Visualizzare le chiavi di accesso dell'account.

 Screenshot that shows the Streaming blob card and configuration pane in diagram view

Dopo aver immesso l'stringa di connessione BLOB, è necessario specificare il nome del contenitore. È anche necessario immettere il modello di percorso all'interno della directory per accedere ai file da impostare come origine per il flusso di dati.

Per i BLOB di streaming, è previsto che il modello di percorso della directory sia un valore dinamico. La data deve far parte del percorso file per il BLOB, a cui viene fatto riferimento come {date}. Inoltre, un asterisco (*) nel modello di percorso, ad esempio {date}/{time}/*.json, non è supportato.

Ad esempio, se si dispone di un BLOB denominato ExampleContainer in cui si archiviano file con estensione json annidati, dove il primo livello è la data di creazione e il secondo livello è l'ora di creazione (aaaa-mm-gg/hh), l'input contenitore sarà "ExampleContainer". Il modello di percorso della directory sarà "{date}/{time}" in cui è possibile modificare il modello di data e ora.

Screenshot that shows the stream blob input boxes used to configure the example container.

Dopo che il BLOB è connesso all'endpoint, tutte le funzionalità per la selezione, l'aggiunta, l'individuazione automatica e la modifica dei campi provenienti dal BLOB di Azure sono uguali a quelli di Hub eventi. È anche possibile modificare le credenziali selezionando l'icona a forma di ingranaggio.

Spesso, quando si usano dati in tempo reale, i dati vengono condensati e gli identificatori vengono usati per rappresentare l'oggetto. Un possibile caso d'uso per i BLOB può essere anche come dati di riferimento per le origini di streaming. I dati di riferimento consentono di unire dati statici ai dati di streaming per arricchire i flussi per l'analisi. Un rapido esempio di quando questa funzionalità sarebbe utile se si installassero sensori in diversi reparti per misurare il numero di persone che entrano nello store in un determinato momento. In genere, l'ID sensore deve essere unito a una tabella statica per indicare l'archivio di reparto e la posizione in cui si trova il sensore. Ora con i dati di riferimento, è possibile aggiungere questi dati durante la fase di inserimento per semplificare la visualizzazione dell'archivio con l'output più elevato degli utenti.

Nota

Un processo flussi di dati di streaming esegue il pull dei dati dall'archivio BLOB di Azure o dall'input di ADLS Gen2 ogni secondo se il file BLOB è disponibile. Se il file BLOB non è disponibile, è presente un backoff esponenziale con un ritardo massimo di 90 secondi.

Tipo di dati

I tipi di dati disponibili per i campi flussi di dati di streaming includono:

  • DateTime: campo Data e ora in formato ISO
  • Float: numero decimale
  • Int: Numero intero
  • Record: oggetto annidato con più record
  • Stringa: testo

Importante

I tipi di dati selezionati per un input di streaming hanno implicazioni importanti a valle per il flusso di dati di streaming. Selezionare il tipo di dati non appena è possibile nel flusso di dati per evitare di doverlo arrestare in un secondo momento per le modifiche.

Aggiungere una trasformazione dei dati di streaming

Le trasformazioni dei dati di streaming sono intrinsecamente diverse dalle trasformazioni dei dati batch. Quasi tutti i dati di streaming hanno un componente temporale che influisce sulle attività di preparazione dei dati coinvolte.

Per aggiungere una trasformazione dei dati di streaming al flusso di dati, selezionare l'icona di trasformazione sulla barra multifunzione per tale trasformazione. La rispettiva scheda viene visualizzata nella visualizzazione diagramma. Dopo averla selezionata, verrà visualizzato il riquadro laterale per la trasformazione per configurarla.

A partire da luglio 2021, i flussi di dati di streaming supportano le trasformazioni di streaming seguenti.

Filtro

Usare la trasformazione Filtro per filtrare gli eventi in base al valore di un campo nell'input. A seconda del tipo di dati (numero o testo), la trasformazione mantiene i valori corrispondenti alla condizione selezionata.

Screenshot that shows the Filter input boxes used to configure the example container.

Nota

All'interno di ogni scheda verranno visualizzate informazioni sugli altri elementi necessari per la trasformazione per essere pronti. Ad esempio, quando si aggiunge una nuova scheda, verrà visualizzato un messaggio "Set-up required". Se manca un connettore del nodo, verrà visualizzato un messaggio "Errore" o "Avviso".

Gestire i campi

La trasformazione Gestisci campi consente di aggiungere, rimuovere o rinominare campi provenienti da un input o da un'altra trasformazione. Le impostazioni nel riquadro laterale offrono la possibilità di aggiungerne una nuova selezionando Aggiungi campo o aggiungendo tutti i campi contemporaneamente.

Screenshot that shows configuration of the Manage fields transformation.

Suggerimento

Dopo aver configurato una scheda, la visualizzazione diagramma offre una panoramica delle impostazioni all'interno della scheda stessa. Ad esempio, nell'area Gestisci campi dell'immagine precedente è possibile visualizzare i primi tre campi gestiti e i nuovi nomi assegnati. Ogni scheda contiene informazioni pertinenti.

Aggregato

È possibile usare la trasformazione Aggregazione per calcolare un'aggregazione (Somma, Minimo, Massimo o Media) ogni volta che si verifica un nuovo evento in un periodo di tempo. Questa operazione consente inoltre di filtrare o filtrare l'aggregazione in base ad altre dimensioni nei dati. È possibile avere una o più aggregazioni nella stessa trasformazione.

Per aggiungere un'aggregazione, selezionare l'icona di trasformazione. Connettere quindi un input, selezionare l'aggregazione, aggiungere eventuali dimensioni filtro o sezione e scegliere il periodo di tempo in cui calcolare l'aggregazione. In questo esempio viene calcolata la somma del valore del pedaggio in base allo stato in cui il veicolo proviene dagli ultimi 10 secondi.

 Screenshot of an aggregate card with an existing aggregate function. The aggregate pane shows the calculation details.

Per aggiungere un'altra aggregazione alla stessa trasformazione, selezionare Aggiungi funzione di aggregazione. Tenere presente che il filtro o la sezione si applica a tutte le aggregazioni nella trasformazione.

Join.

Usare la trasformazione Join per combinare gli eventi di due input in base alle coppie di campi selezionate. Se non si seleziona una coppia di campi, il join è basato sul tempo per impostazione predefinita. Il valore predefinito è ciò che rende questa trasformazione diversa da una batch.

Come per i normali join, sono disponibili diverse opzioni per la logica di join:

  • Inner join: includere solo i record di entrambe le tabelle in cui la coppia corrisponde. In questo esempio, questa è la posizione in cui la targa corrisponde a entrambi gli input.
  • Left outer join: includere tutti i record della tabella sinistra (prima) e solo i record del secondo che corrispondono alla coppia di campi. Se non esiste alcuna corrispondenza, i campi del secondo input vengono impostati come vuoti.

Per selezionare il tipo di join, selezionare l'icona per il tipo preferito nel riquadro laterale.

Infine, selezionare il periodo di tempo in cui si vuole calcolare il join. In questo esempio, il join esamina gli ultimi 10 secondi. Tenere presente che il periodo è più lungo, meno frequente è l'output e più risorse di elaborazione usate per la trasformazione.

Per impostazione predefinita, vengono inclusi tutti i campi di entrambe le tabelle. I prefissi a sinistra (primo nodo) e a destra (secondo nodo) nell'output consentono di distinguere l'origine.

Screenshot of the event hub and join cards with the join configuration pane open.

Raggruppa per

Usare la trasformazione Group by per calcolare le aggregazioni in tutti gli eventi in un determinato intervallo di tempo. Puoi raggruppare i valori di uno o più campi. È simile alla trasformazione Aggregazione , ma offre altre opzioni per le aggregazioni. Include anche opzioni di intervallo di tempo più complesse. Analogamente a Aggregate, è anche possibile aggiungere più aggregazioni per trasformazione.

Le aggregazioni disponibili in questa trasformazione sono: Media, Conteggio, Massimo, Minimo, Percentile (continuo e discreto), Deviazione standard, Somma e Varianza.

Per configurare questa trasformazione:

  1. Selezionare l'aggregazione preferita.
  2. Scegliere il campo su cui si vuole aggregare.
  3. Selezionare un campo facoltativo group-by se si desidera ottenere il calcolo aggregato su un'altra dimensione o categoria (ad esempio, Stato).
  4. Scegliere la funzione per le finestre temporali.

Per aggiungere un'altra aggregazione alla stessa trasformazione, selezionare Aggiungi funzione di aggregazione. Tenere presente che il campo Raggruppa per e la funzione di finestra si applica a tutte le aggregazioni nella trasformazione.

Screenshot of the Group by card with the configuration pane open.

Un timestamp per la fine dell'intervallo di tempo viene fornito come parte dell'output della trasformazione per riferimento.

Una sezione più avanti in questo articolo illustra ogni tipo di intervallo di tempo disponibile per questa trasformazione.

Popolare

Usare la trasformazione Unione per connettere due o più input per aggiungere eventi con campi condivisi (con lo stesso nome e tipo di dati) in una tabella. I campi che non corrispondono vengono rimossi e non vengono inclusi nell'output.

Configurare le funzioni dell'intervallo di tempo

Le finestre temporali sono uno dei concetti più complessi dei dati di streaming. Questo concetto si trova al centro dell'analisi di streaming.

Con i flussi di dati di streaming, è possibile configurare le finestre temporali quando si aggregano i dati come opzione per la trasformazione Raggruppa per .

Nota

Tenere presente che tutti i risultati di output per le operazioni di windowing vengono calcolati alla fine dell'intervallo di tempo. L'output della finestra sarà un singolo evento basato sulla funzione di aggregazione. Questo evento avrà il timestamp della fine della finestra e tutte le funzioni della finestra sono definite con una lunghezza fissa.

Diagram that shows three time windows on a graph.

Esistono cinque tipi di intervalli di tempo tra cui scegliere: a cascata, salto, scorrimento, sessione e snapshot.

Finestra a cascata

La cascata è il tipo più comune di intervallo temporale. Le caratteristiche principali delle finestre a cascata sono che si ripetono, hanno la stessa durata e non si sovrappongono. Un evento non può appartenere a più finestre a cascata.

Diagram that shows a 10-second tumbling window.

Quando si configura una finestra a cascata nei flussi di dati di streaming, è necessario specificare la durata della finestra (uguale per tutte le finestre in questo caso). È anche possibile specificare un offset facoltativo. Per impostazione predefinita, le finestre a cascata includono la fine della finestra ed escludono l'inizio. È possibile usare questo parametro per modificare questo comportamento e includere gli eventi all'inizio della finestra ed escludere quelli alla fine.

Screenshot that shows duration and offset settings for a tumbling time window.

Finestra di salto

Salto delle finestre "hop" avanti nel tempo in base a un periodo fisso. È possibile considerarli come finestre a cascata che possono sovrapporsi e essere generate più spesso delle dimensioni della finestra. Gli eventi possono appartenere a più set di risultati per una finestra di salto. Per fare in modo che una finestra di salto corrisponda a una finestra a cascata, è possibile specificare le dimensioni dell'hop in modo che corrispondano alle dimensioni della finestra.

Diagram that shows a 10-second hopping window.

Quando si configura una finestra di salto nei flussi di dati di streaming, è necessario specificare la durata della finestra (uguale a quella delle finestre a cascata). È anche necessario specificare la dimensione dell'hop, che indica ai flussi di dati di streaming la frequenza con cui si vuole calcolare l'aggregazione per la durata definita.

Il parametro offset è disponibile anche nelle finestre di salto per lo stesso motivo delle finestre a cascata. Definisce la logica per includere ed escludere eventi per l'inizio e la fine della finestra di salto.

Screenshot that shows hop size, duration, and offset settings for a hopping time window.

Finestra temporale scorrevole

Le finestre scorrevoli, a differenza delle finestre a cascata o di salto, calcolano l'aggregazione solo per i punti nel tempo in cui il contenuto della finestra cambia effettivamente. Quando un evento entra o esce dalla finestra, viene calcolata l'aggregazione. Quindi, ogni finestra ha almeno un evento. Analogamente alle finestre di salto, gli eventi possono appartenere a più finestre scorrevoli.

Diagram that shows a 10-second sliding window.

L'unico parametro necessario per una finestra scorrevole è la durata, perché gli eventi stessi definiscono all'avvio della finestra. Non è necessaria alcuna logica di offset.

Screenshot that shows the duration setting for a sliding time window.

Finestra della sessione

Le finestre di sessione sono il tipo più complesso. Raggruppano gli eventi che arrivano in momenti simili, filtrando i periodi di tempo in cui non sono presenti dati. Per questa finestra, è necessario specificare:

  • Timeout: tempo di attesa se non sono presenti nuovi dati.
  • Durata massima: il tempo più lungo calcolato dall'aggregazione se i dati continuano a essere in arrivo.

È anche possibile definire una partizione, se necessario.

Diagram that shows session windows with a five-minute timeout.

È possibile configurare una finestra di sessione direttamente nel riquadro laterale per la trasformazione. Se si specifica una partizione, l'aggregazione raggruppa solo gli eventi per la stessa chiave.

Screenshot that shows the duration, timeout, and partition settings for a session time window.

Finestra snapshot

Eventi del gruppo di finestre snapshot con lo stesso timestamp. A differenza di altre finestre, uno snapshot non richiede parametri perché usa l'ora dal sistema.

Diagram that shows a snapshot window on a 35-minute timeline.

Definire gli output

Dopo aver configurato input e trasformazioni, è possibile definire uno o più output. A partire da luglio 2021, i flussi di dati di streaming supportano le tabelle di Power BI come unico tipo di output.

Questo output è una tabella del flusso di dati, ovvero un'entità, che è possibile usare per creare report in Power BI Desktop. È necessario unire i nodi del passaggio precedente con l'output che si sta creando per renderlo funzionante. Successivamente, denominare la tabella.

Screenshot that shows the output table card and output table configuration pane.

Dopo la connessione al flusso di dati, questa tabella sarà disponibile per creare oggetti visivi aggiornati in tempo reale per i report.

Anteprima dei dati ed errori

I flussi di dati di streaming offrono strumenti che consentono di creare, risolvere i problemi e valutare le prestazioni della pipeline di analisi per i dati di streaming.

Anteprima dei dati in tempo reale per gli input

Quando ci si connette a un hub eventi o a un hub IoT e si seleziona la scheda nella visualizzazione diagramma (scheda Anteprima dati), si ottiene un'anteprima in tempo reale dei dati in arrivo se sono soddisfatte tutte le condizioni seguenti:

  • Viene eseguito il push dei dati.
  • L'input è configurato correttamente.
  • Sono stati aggiunti campi.

Come illustrato nello screenshot seguente, se si vuole visualizzare o eseguire il drill-down in un elemento specifico, è possibile sospendere l'anteprima (1). Oppure puoi ricominciare se hai finito.

È anche possibile visualizzare i dettagli di un record specifico (una "cella" nella tabella) selezionandolo e quindi selezionando Mostra dettagli o Nascondi dettagli (2). Lo screenshot mostra la visualizzazione dettagliata di un oggetto annidato in un record.

Screenshot that shows a live data preview with the pause and show or hide options highlighted.

Anteprima statica per trasformazioni e output

Dopo aver aggiunto e configurato tutti i passaggi nella visualizzazione diagramma, è possibile testarne il comportamento selezionando il pulsante dati statici.

Dopo aver eseguito questa operazione, i flussi di dati di streaming valutano tutte le trasformazioni e gli output configurati correttamente. I flussi di dati in streaming visualizzano quindi i risultati nell'anteprima dei dati statici, come illustrato nell'immagine seguente.

Screenshot that shows a static data preview with the refresh and hide options highlighted.

È possibile aggiornare l'anteprima selezionando Aggiorna anteprima statica (1). Quando si esegue questa operazione, i flussi di dati in streaming accettano nuovi dati dall'input e valutano di nuovo tutte le trasformazioni e gli output con tutti gli aggiornamenti che potrebbero essere stati eseguiti. L'opzione Mostra o Nascondi dettagli è disponibile anche (2).

Errori di creazione

Se sono presenti errori o avvisi di creazione, nella scheda Errori di creazione (1) vengono elencati, come illustrato nello screenshot seguente. L'elenco include i dettagli dell'errore o dell'avviso, il tipo di scheda (input, trasformazione o output), il livello di errore e una descrizione dell'errore o dell'avviso (2). Quando si seleziona uno degli errori o degli avvisi, viene selezionata la rispettiva scheda e viene aperto il riquadro laterale di configurazione per apportare le modifiche necessarie.

Screenshot that shows a list of authoring errors.

Errori di runtime

L'ultima scheda disponibile nell'anteprima è Errori di runtime (1), come illustrato nello screenshot seguente. Questa scheda elenca eventuali errori durante il processo di inserimento e analisi del flusso di dati di streaming dopo l'avvio. Ad esempio, è possibile che venga visualizzato un errore di runtime se un messaggio è stato danneggiato e il flusso di dati non è riuscito ad inserirlo ed eseguire le trasformazioni definite.

Poiché i flussi di dati potrebbero essere eseguiti per un lungo periodo di tempo, questa scheda offre la possibilità di filtrare in base all'intervallo di tempo e scaricare l'elenco degli errori e aggiornarlo, se necessario (2).

Screenshot that shows the tab for runtime errors, along with options for filtering, downloading, and refreshing.

Modificare le impostazioni per i flussi di dati di streaming

Come per i flussi di dati regolari, le impostazioni per i flussi di dati di streaming possono essere modificate a seconda delle esigenze dei proprietari e degli autori. Le impostazioni seguenti sono univoche per i flussi di dati in streaming. Per le altre impostazioni, a causa dell'infrastruttura condivisa tra i due tipi di flussi di dati, è possibile presupporre che l'uso sia lo stesso.

Screenshot that shows settings for a streaming dataflow.

  • Cronologia aggiornamenti: poiché i flussi di dati di streaming vengono eseguiti in modo continuo, la cronologia degli aggiornamenti mostra solo le informazioni relative all'avvio del flusso di dati, all'annullamento o all'esito negativo (con dettagli e codici di errore, se applicabile). Queste informazioni sono simili a quanto appare per i flussi di dati regolari. È possibile usare queste informazioni per risolvere i problemi o fornire il supporto di Power BI con i dettagli richiesti.

  • Credenziali origine dati: questa impostazione mostra gli input configurati per il flusso di dati di streaming specifico.

  • Impostazioni avanzate del motore di calcolo: i flussi di dati di streaming necessitano del motore di calcolo avanzato per fornire oggetti visivi in tempo reale, quindi questa impostazione viene attivata per impostazione predefinita e non può essere modificata.

  • Durata conservazione: questa impostazione è specifica per i flussi di dati in streaming. Qui è possibile definire per quanto tempo si vogliono mantenere i dati in tempo reale da visualizzare nei report. I dati cronologici vengono salvati per impostazione predefinita in Archiviazione BLOB di Azure. Questa impostazione è specifica del lato in tempo reale dei dati (archiviazione ad accesso frequente). Il valore minimo è 1 giorno o 24 ore.

    Importante

    La quantità di dati ad accesso frequente archiviati da questa durata di conservazione influisce direttamente sulle prestazioni degli oggetti visivi in tempo reale quando si creano report su questi dati. Maggiore è la conservazione disponibile qui, più gli oggetti visivi in tempo reale nei report possono essere influenzati da prestazioni ridotte. Se è necessario eseguire analisi cronologiche, è consigliabile usare l'archiviazione ad accesso sporadico fornita per i flussi di dati di streaming.

Eseguire e modificare un flusso di dati di streaming

Dopo aver salvato e configurato il flusso di dati di streaming, tutto è pronto per l'esecuzione. È quindi possibile iniziare a inserire dati in Power BI con la logica di analisi di streaming definita.

Eseguire il flusso di dati di streaming

Per avviare il flusso di dati di streaming, salvare prima di tutto il flusso di dati e passare all'area di lavoro in cui è stata creata. Passare il puntatore del mouse sul flusso di dati di streaming e selezionare il pulsante play visualizzato. Un messaggio popup indica che il flusso di dati è in corso di avvio.

Screenshot that shows the play button for starting a streaming dataflow.

Nota

Potrebbero essere necessari fino a cinque minuti prima che i dati inizino a essere inseriti e che vengano visualizzati i dati in arrivo per creare report e dashboard in Power BI Desktop.

Modificare il flusso di dati di streaming

Mentre è in esecuzione un flusso di dati, non può essere modificato. È tuttavia possibile passare a un flusso di dati in streaming in uno stato in esecuzione e vedere la logica di analisi su cui si basa il flusso di dati.

Quando si entra in un flusso di dati in esecuzione, tutte le opzioni di modifica vengono disabilitate e viene visualizzato un messaggio: "Il flusso di dati non può essere modificato durante l'esecuzione. Arrestare il flusso di dati se si vuole continuare." Anche l'anteprima dei dati è disabilitata.

Per modificare il flusso di dati di streaming, è necessario arrestarlo. Un flusso di dati arrestato genera dati mancanti.

L'unica esperienza disponibile durante l'esecuzione di un flusso di dati è la scheda Errori di runtime, in cui è possibile monitorare il comportamento del flusso di dati per eventuali messaggi eliminati e situazioni simili.

Screenshot that shows the disabled data preview when a streaming dataflow is running.

Prendere in considerazione l'archiviazione dei dati durante la modifica del flusso di dati

Quando si modifica un flusso di dati, è necessario tenere conto di altre considerazioni. Analogamente alle modifiche apportate a uno schema per i flussi di dati regolari, se si apportano modifiche a una tabella di output, si perdono i dati già sottoposti a push e salvati in Power BI. L'interfaccia fornisce informazioni chiare sulle conseguenze di una di queste modifiche nel flusso di dati di streaming, insieme alle scelte per le modifiche apportate prima del salvataggio.

Questa esperienza è illustrata meglio con un esempio. Lo screenshot seguente mostra il messaggio visualizzato quando si aggiunge una colonna a una tabella, si modifica il nome di una seconda tabella e si lascia una terza tabella uguale a quella precedente.

Screenshot that shows an informational message that lists the changes made to output tables and their impact.

In questo esempio, i dati già salvati in entrambe le tabelle con modifiche dello schema e del nome vengono eliminati se si salvano le modifiche. Per la tabella che rimaneva invariata, è possibile eliminare tutti i dati obsoleti e iniziare da zero o salvarli per un'analisi successiva insieme ai nuovi dati inclusi.

Tenere presenti queste sfumature durante la modifica del flusso di dati di streaming, soprattutto se sono necessari dati cronologici disponibili in un secondo momento per ulteriori analisi.

Utilizzare un flusso di dati di streaming

Dopo aver eseguito il flusso di dati, è possibile iniziare a creare contenuto sui dati di streaming. Non ci sono modifiche strutturali rispetto a ciò che è necessario fare per creare report aggiornati in tempo reale. Ci sono alcune sfumature e aggiornamenti da considerare in modo da poter sfruttare questo nuovo tipo di preparazione dei dati per lo streaming dei dati.

Configurare l'archiviazione dei dati

Come accennato in precedenza, i flussi di dati in streaming salvano i dati nelle due posizioni seguenti. L'uso di queste origini dipende dal tipo di analisi che si sta tentando di eseguire.

  • Archiviazione ad accesso frequente (analisi in tempo reale): quando i dati vengono inseriti in Power BI dai flussi di dati in streaming, i dati vengono archiviati in una posizione ad accesso frequente per l'accesso con oggetti visivi in tempo reale. La quantità di dati salvati in questa risorsa di archiviazione dipende dal valore definito per la durata di conservazione nelle impostazioni del flusso di dati di streaming. Il valore predefinito (e minimo) è 24 ore.
  • Archiviazione ad accesso sporadico (analisi cronologica): qualsiasi periodo di tempo che non rientra nel periodo definito per la durata della conservazione viene salvato nell'archiviazione ad accesso sporadico (BLOB) in Power BI per poter essere usato, se necessario.

Nota

Si verifica una sovrapposizione tra queste due posizioni di archiviazione dei dati. Se è necessario usare entrambe le posizioni in combinazione (ad esempio, una variazione percentuale giornaliera), potrebbe essere necessario deduplicare i record. Dipende dai calcoli di Business Intelligence per le gerarchie temporali che si stanno effettuando e dai criteri di conservazione.

Connessione ai flussi di dati in streaming da Power BI Desktop

Power BI Desktop offre un connettore denominato Flussi di dati da usare. Come parte di questo connettore per i flussi di dati in streaming, verranno visualizzate due tabelle che corrispondono all'archiviazione dei dati descritta in precedenza.

Per connettersi ai dati per i flussi di dati in streaming:

  1. Passare a Recupera dati, selezionare Power Platform e quindi scegliere il connettore Flussi di dati.

    Screenshot of the Get Data window, Power Platform is selected in the navigation pane and Dataflows is highlighted in the main pane.

  2. Accedere con le credenziali di Power BI.

  3. Selezionare aree di lavoro. Cercare quello che contiene il flusso di dati di streaming e selezionare il flusso di dati. In questo esempio viene chiamato il flusso di dati di streamingToll.)

  4. Si noti che tutte le tabelle di output vengono visualizzate due volte: una per i dati di streaming (ad accesso frequente) e una per i dati archiviati (ad accesso sporadico). È possibile differenziarli in base alle etichette aggiunte dopo i nomi delle tabelle e per le icone.

    Screenshot of a list of output tables in the Toll dataflow.

  5. Connessione ai dati di streaming. Il caso dei dati archiviati è lo stesso, disponibile solo in modalità di importazione. Selezionare le tabelle che includono le etichette Streaming e Accesso frequente e quindi selezionare Carica.

    Screenshot that shows hot output tables selected for streaming dataflows in Power BI Desktop.

  6. Quando viene chiesto di scegliere una modalità di archiviazione, selezionare DirectQuery se l'obiettivo è creare oggetti visivi in tempo reale.

    Screenshot that shows the storage mode selected for streaming dataflows in Power BI Desktop.

È ora possibile creare oggetti visivi, misure e altro ancora usando le funzionalità disponibili in Power BI Desktop.

Nota

Il normale connettore del flusso di dati di Power BI è ancora disponibile e funzionerà con flussi di dati di streaming con due avvertenze:

  • Consente solo di connettersi all'archiviazione ad accesso frequente.
  • L'anteprima dei dati nel connettore non funziona con flussi di dati di streaming.

Attivare l'aggiornamento automatico della pagina per gli oggetti visivi in tempo reale

Dopo aver pronto il report e aver aggiunto tutto il contenuto che si vuole condividere, l'unico passaggio a sinistra consiste nell'assicurarsi che gli oggetti visivi vengano aggiornati in tempo reale. È possibile usare una funzionalità denominata aggiornamento pagina automatico. Questa funzionalità consente di aggiornare gli oggetti visivi da un'origine DirectQuery fino a un secondo.

Per altre informazioni sulla funzionalità, vedere Aggiornamento pagina automatico in Power BI. Questo articolo include informazioni su come usarlo, su come configurarlo e su come contattare l'amministratore in caso di problemi. Di seguito sono riportate le nozioni di base su come configurarla:

  1. Passare alla pagina del report in cui si desidera aggiornare gli oggetti visivi in tempo reale.

  2. Cancellare qualsiasi oggetto visivo nella pagina. Se possibile, selezionare lo sfondo della pagina.

  3. Passare al riquadro formato (1) e attivare Aggiornamento pagina (2).

    Screenshot that shows selections for turning on automatic page refresh.

  4. Configurare la frequenza desiderata (fino a ogni secondo se l'amministratore lo ha consentito).

    Screenshot that shows frequency settings for automatic page refresh.

  5. Per condividere un report in tempo reale, eseguire prima di tutto la pubblicazione nel servizio Power BI. È quindi possibile configurare le credenziali del flusso di dati per il modello semantico e la condivisione.

Suggerimento

Se il report non viene aggiornato nel modo più rapido necessario o in tempo reale, controllare la documentazione per l'aggiornamento automatico della pagina. Seguire le domande frequenti e le istruzioni per la risoluzione dei problemi per capire perché questo problema potrebbe verificarsi.

Considerazioni e limitazioni

Limitazioni generali

  • Per la creazione e l'esecuzione di flussi di dati di streaming, è necessaria una sottoscrizione di Power BI Premium (capacità o PPU).
  • È consentito un solo tipo di flusso di dati per ogni area di lavoro.
  • Il collegamento di flussi di dati regolari e di streaming non è possibile.
  • Le capacità inferiori a A3 non consentono l'uso di flussi di dati di streaming.
  • Se i flussi di dati o il motore di calcolo avanzato non sono abilitati in un tenant, non è possibile creare o eseguire flussi di dati di streaming.
  • Le aree di lavoro connesse a un account di archiviazione non sono supportate.
  • Ogni flusso di dati può fornire fino a 1 MB al secondo di velocità effettiva.

Disponibilità

L'anteprima dei flussi di dati di streaming non è disponibile nelle aree seguenti:

  • India centrale
  • Germania settentrionale
  • Norvegia orientale
  • Norvegia occidentale
  • Emirati Arabi Uniti centrali
  • Sudafrica settentrionale
  • Sudafrica occidentale
  • Svizzera settentrionale
  • Svizzera occidentale
  • Brasile meridionale

Licenze

Il numero di flussi di dati di streaming consentiti per tenant dipende dalla licenza usata:

  • Per le capacità regolari, usare la formula seguente per calcolare il numero massimo di flussi di dati di streaming consentiti in una capacità:

    Numero massimo di flussi di dati di streaming per capacità = vCore nella capacità x 5

    Ad esempio, P1 ha 8 vCore: 8 * 5 = 40 flussi di dati di streaming.

  • Per Premium per utente, è consentito un flusso di dati di streaming per utente. Se un altro utente vuole usare un flusso di dati in streaming in un'area di lavoro PPU, è necessaria anche una licenza PPU.

Creazione di flussi di dati

Quando si creano flussi di dati di streaming, tenere presenti le considerazioni seguenti:

  • Il proprietario di un flusso di dati può apportare modifiche solo e può apportare modifiche solo se il flusso di dati non è in esecuzione.
  • I flussi di dati di streaming non sono disponibili nell'area di lavoro personale.

Connettersi con Power BI Desktop

È possibile accedere all'archiviazione ad accesso sporadico solo usando il connettore Flussi di dati disponibile a partire dall'aggiornamento di Power BI Desktop di luglio 2021. Il connettore del flusso di dati di Power BI precedente consente solo le connessioni all'archiviazione di dati in streaming (ad accesso frequente). L'anteprima dei dati del connettore non funziona.

Questo articolo ha fornito una panoramica della preparazione dei dati in streaming self-service usando flussi di dati in streaming. Gli articoli seguenti forniscono informazioni su come testare questa funzionalità e su come usare altre funzionalità di streaming dei dati in Power BI: