Condividi tramite


Procedure consigliate per il riutilizzo dei flussi di dati in ambienti e aree di lavoro

Suggerimento

Power BI Dataflow Gen1 è ora in uno stato legacy e non riceverà nuovi investimenti di funzionalità. Per i clienti Premium con accesso all'infrastruttura, Dataflow Gen2 è il percorso consigliato, offrendo miglioramenti in termini di prestazioni, scalabilità, affidabilità, funzionalità e intelligenza artificiale predefinita. I clienti pro/PPU possono continuare a usare Gen1 perché le linee guida di Gen2 per questi scenari sono in continua evoluzione. Per indicazioni sull'aggiornamento, vedere Eseguire l'aggiornamento da Dataflow Gen1 a Dataflow Gen2 .

Questo articolo illustra una raccolta di procedure consigliate per riutilizzare i flussi di dati in modo efficace ed efficiente. Leggere questo articolo per evitare problemi di progettazione e potenziali problemi di prestazioni durante lo sviluppo di flussi di dati per il riutilizzo.

Separare i flussi di trasformazione dei dati dai flussi di staging/estrazione dei dati

Se un flusso di dati esegue tutte le azioni, è difficile riutilizzare le tabelle in altri flussi di dati o per altri scopi. I flussi di dati migliori da riutilizzare sono i flussi di dati che eseguono solo alcune azioni. La creazione di flussi di dati specializzati in un'attività specifica è uno dei modi migliori per riutilizzarli. Se si dispone di un set di flussi di dati usati come flussi di dati di staging, l'unica azione consiste nell'estrarre i dati as-is dal sistema di origine. Questi flussi di dati possono essere riutilizzati in più altri flussi di dati.

Se sono presenti flussi di dati di trasformazione dei dati, è possibile suddividerli in flussi di dati che eseguono trasformazioni comuni. Ogni flusso di dati può eseguire solo alcune azioni. Queste poche azioni per flusso di dati assicurano che l'output di tale flusso di dati sia riutilizzabile da altri flussi di dati.

Flusso di dati che esegue solo alcune azioni.

Immagine con dati estratti da un'origine dati verso flussi di dati di transizione, in cui le tabelle vengono archiviate in Dataverse o in Azure Data Lake Storage. I dati vengono quindi spostati nei flussi di dati di trasformazione in cui i dati vengono trasformati e convertiti nella struttura del data warehouse. Infine, i dati vengono caricati in un modello semantico di Power BI.

Usare più aree di lavoro

Ogni area di lavoro (o ambiente) è disponibile solo per i membri dell'area di lavoro. Se si compilano tutti i flussi di dati in un'area di lavoro, si riduce al minimo il riutilizzo dei flussi di dati. È possibile avere alcune aree di lavoro generiche per i flussi di dati che elaborano tabelle a livello aziendale. È anche possibile avere un'area di lavoro per i flussi di dati per elaborare tabelle in più reparti. È anche possibile avere alcune aree di lavoro per i flussi di dati da usare solo in reparti specifici.

Immagine che mostra le aree di lavoro separate.

Impostare i livelli di accesso corretti nelle aree di lavoro

Per concedere l'accesso ai flussi di dati in altre aree di lavoro per usare l'output di un flusso di dati in un'area di lavoro, è sufficiente concedere l'accesso alla visualizzazione nell'area di lavoro. Per altre informazioni sugli altri ruoli in un'area di lavoro di Power BI, passare a Ruoli nelle nuove aree di lavoro.

Screenshot che mostra come accedere all'area di lavoro di Power BI.

Approvazione del flusso di dati in Power BI

In un'organizzazione tenant possono essere creati molti flussi di dati e può risultare difficile sapere quale flusso di dati è più affidabile. Gli autori di un flusso di dati, o gli utenti che hanno accesso alla modifica, possono approvare il flusso di dati a tre livelli: nessuna approvazione, promosso o certificato.

Questi livelli di verifica dell'autenticità consentono agli utenti di trovare flussi di dati affidabili più semplici e veloci. Il flusso di dati con un livello di verifica dell'autenticità superiore viene visualizzato per primo. L'amministratore di Power BI può delegare la possibilità di approvare i flussi di dati al livello certificato ad altre persone. Altre informazioni: Approvazione - Promozione e certificazione del contenuto di Power BI

Screenshot dello strumento di navigazione di Power Query che mostra le etichette di approvazione promosse e certificate in flussi di dati specifici.

Separare le tabelle in più flussi di dati

È possibile avere più tabelle in un flusso di dati. Uno dei motivi per cui è possibile suddividere le tabelle in più flussi di dati è quello appreso in precedenza in questo articolo sulla separazione dei flussi di dati di inserimento dati e trasformazione dei dati. Un altro motivo valido per fare in modo che le tabelle in più flussi di dati siano quando si desidera una pianificazione dell'aggiornamento diversa rispetto ad altre tabelle.

Nell'esempio illustrato nell'immagine seguente, la tabella delle vendite deve essere aggiornata ogni quattro ore. La tabella data deve essere aggiornata solo una volta al giorno per mantenere aggiornato il record di data corrente. E una tabella di mapping del prodotto deve essere aggiornata solo una volta alla settimana. Se tutte queste tabelle sono presenti in un flusso di dati, è disponibile solo un'opzione di aggiornamento per tutte. Tuttavia, se si suddivideno queste tabelle in più flussi di dati, è possibile pianificare l'aggiornamento di ogni flusso di dati separatamente.

Immagine che mostra i flussi di dati con pianificazioni diverse per l'aggiornamento.

Buoni candidati per le tabelle di flusso di dati

Quando si sviluppano soluzioni usando Power Query negli strumenti desktop, è possibile chiedersi se stessi; quale di queste tabelle è un buon candidato per essere spostato in un flusso di dati? Le tabelle migliori da spostare nel flusso di dati sono quelle tabelle che devono essere usate in più di una soluzione o più di un ambiente o di un servizio. Ad esempio, la tabella Date illustrata nell'immagine seguente deve essere usata in due file di Power BI separati. Anziché duplicare tale tabella in ogni file, è possibile compilare la tabella in un flusso di dati come tabella e riutilizzarla in tali file di Power BI.

Immagine che mostra una tabella condivisa usata in un flusso di dati.