Cosa sono i flussi di dati?

Suggerimento

Provare Dataflow Gen2 in Data Factory in Microsoft Fabric, una soluzione di analisi completa per le aziende. Microsoft Fabric copre tutti gli elementi, dallo spostamento dei dati all'analisi scientifica dei dati, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Scopri come avviare gratuitamente una nuova versione di valutazione .

I flussi di dati sono una tecnologia self-service, basata sul cloud e di preparazione dei dati. I flussi di dati consentono ai clienti di inserire, trasformare e caricare dati in ambienti Microsoft Dataverse, aree di lavoro di Power BI o account azure Data Lake dell'organizzazione Archiviazione. I flussi di dati vengono creati usando Power Query, un'esperienza unificata di connettività e preparazione dei dati già inclusa in molti prodotti Microsoft, tra cui Excel e Power BI. I clienti possono attivare flussi di dati per l'esecuzione su richiesta o automaticamente in base a una pianificazione; i dati vengono sempre aggiornati.

I flussi di dati possono essere creati in più prodotti Microsoft

I flussi di dati sono disponibili in più prodotti Microsoft e non richiedono la creazione o l'esecuzione di una licenza specifica del flusso di dati. I flussi di dati sono disponibili in Power Apps, Power BI e Dynamics 365 Customer Insights. La possibilità di creare ed eseguire flussi di dati è combinata con le licenze di tali prodotti. Le funzionalità del flusso di dati sono principalmente comuni in tutti i prodotti in cui sono presenti, ma alcune funzionalità specifiche del prodotto potrebbero esistere nei flussi di dati creati in un prodotto rispetto a un altro.

Come funziona il flusso di dati?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

L'immagine precedente mostra una visualizzazione complessiva del modo in cui viene definito un flusso di dati. Un flusso di dati ottiene dati da origini dati diverse (sono già supportate più di 80 origini dati). In base alle trasformazioni configurate con l'esperienza di creazione di Power Query, il flusso di dati trasforma quindi i dati usando il motore del flusso di dati. Infine, i dati vengono caricati nella destinazione di output, che può essere un ambiente Microsoft Power Platform, un'area di lavoro di Power BI o l'account azure Data Lake Archiviazione dell'organizzazione.

I flussi di dati vengono eseguiti nel cloud

I flussi di dati sono basati sul cloud. Quando un flusso di dati viene creato e salvato, la relativa definizione viene archiviata nel cloud. Un flusso di dati viene eseguito anche nel cloud. Tuttavia, se un'origine dati è locale, è possibile usare un gateway dati locale per estrarre i dati nel cloud. Quando viene attivata un'esecuzione del flusso di dati, la trasformazione e il calcolo dei dati vengono eseguiti nel cloud e la destinazione si trova sempre nel cloud.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

I flussi di dati usano un potente motore di trasformazione

Power Query è il motore di trasformazione dati usato nel flusso di dati. Questo motore è in grado di supportare molte trasformazioni avanzate. Usa anche un'interfaccia utente grafica semplice, ma potente, denominata editor di Power Query. È possibile usare i flussi di dati con questo editor per sviluppare soluzioni di integrazione dei dati più velocemente e più facilmente.

Screenshot showing an example of Power Query transformations.

Integrazione del flusso di dati con Microsoft Power Platform e Dynamics 365

Poiché un flusso di dati archivia le tabelle risultanti nell'archiviazione basata sul cloud, altri servizi possono interagire con i dati prodotti dai flussi di dati.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Ad esempio, Power BI, Power Apps, Power Automate, Power Virtual Agents e le applicazioni Dynamics 365 possono ottenere i dati generati dal flusso di dati connettendosi a Dataverse, a un connettore del flusso di dati power platform o direttamente tramite il lake, a seconda della destinazione configurata in fase di creazione del flusso di dati.

Vantaggi dei flussi di dati

L'elenco seguente evidenzia alcuni dei vantaggi derivanti dall'uso dei flussi di dati:

  • Un flusso di dati separa il livello di trasformazione dei dati dal livello di modellazione e visualizzazione in una soluzione Power BI.

  • Il codice di trasformazione dei dati può risiedere in una posizione centrale, un flusso di dati, anziché essere distribuito tra più artefatti.

  • Un creatore di flussi di dati necessita solo di competenze di Power Query. In un ambiente con più creatori, l'autore del flusso di dati può far parte di un team che insieme compila l'intera soluzione BI o l'applicazione operativa.

  • Un flusso di dati è indipendente dal prodotto. Non è solo un componente di Power BI. è possibile ottenere i dati in altri strumenti e servizi.

  • I flussi di dati sfruttano Power Query, un'esperienza di trasformazione dei dati avanzata, grafica e self-service.

  • I flussi di dati vengono eseguiti interamente nel cloud. Non è necessaria alcuna infrastruttura aggiuntiva.

  • Sono disponibili più opzioni per iniziare a usare i flussi di dati, usando le licenze per Power Apps, Power BI e Customer Insights.

  • Anche se i flussi di dati sono in grado di eseguire trasformazioni avanzate, sono progettati per scenari self-service e non richiedono background IT o sviluppatore.

Scenari di casi d'uso per i flussi di dati

È possibile usare i flussi di dati per molti scopi. Gli scenari seguenti forniscono alcuni esempi di casi d'uso comuni per i flussi di dati.

Migrazione dei dati dai sistemi legacy

In questo scenario, la decisione è stata presa da un'organizzazione di usare Power Apps per la nuova esperienza dell'interfaccia utente anziché il sistema locale legacy. Power Apps, Power Automate e AI Builder usano tutti Dataverse come sistema di archiviazione dati primario. È possibile eseguire la migrazione dei dati correnti nel sistema locale esistente in Dataverse usando un flusso di dati e quindi questi prodotti possono usare tali dati.

Uso dei flussi di dati per creare un data warehouse

È possibile usare i flussi di dati come sostituzione per altri strumenti di estrazione, trasformazione, caricamento (ETL) per creare un data warehouse. In questo scenario, i data engineer di un'azienda decidono di usare i flussi di dati per creare il data warehouse progettato per lo schema star, incluse le tabelle dei fatti e delle dimensioni in Data Lake Archiviazione. Power BI viene quindi usato per generare report e dashboard recuperando i dati dai flussi di dati.

Image of how to build a data warehouse using dataflows.

Uso dei flussi di dati per creare un modello dimensionale

È possibile usare i flussi di dati come sostituzione di altri strumenti ETL per creare un modello dimensionale. Ad esempio, i data engineer di un'azienda decidono di usare i flussi di dati per creare il modello dimensionale progettato con schema star, incluse le tabelle dei fatti e delle dimensioni in Azure Data Lake Archiviazione Gen2. Power BI viene quindi usato per generare report e dashboard recuperando i dati dai flussi di dati.

Image of how to build a dimensional model using dataflows.

Centralizzare la preparazione e il riutilizzo dei dati dei modelli semantici tra più soluzioni Power BI

Se più soluzioni Power BI usano la stessa versione trasformata di una tabella, il processo di creazione della tabella verrà ripetuto più volte. Questo aumenta il carico nel sistema di origine, utilizza più risorse e crea dati duplicati con più punti di errore. È invece possibile creare un singolo flusso di dati per calcolare i dati per tutte le soluzioni. Power BI può quindi riutilizzare il risultato della trasformazione in tutte le soluzioni. Il flusso di dati, se usato in questo modo, può far parte di un'architettura di implementazione affidabile di Power BI che evita i duplicati del codice di Power Query e riduce i costi di manutenzione del livello di integrazione dei dati.

Image of how tables can be reused across multiple solutions.

Passaggi successivi

Gli articoli seguenti forniscono ulteriori materiali di studio per i flussi di dati.