Condividi tramite


Procedure consigliate per il riutilizzo dei flussi di dati in ambienti e aree di lavoro

Questo articolo illustra una raccolta di procedure consigliate per riutilizzare i flussi di dati in modo efficace ed efficiente. Leggere questo articolo per evitare problemi di progettazione e potenziali problemi di prestazioni durante lo sviluppo di flussi di dati per il riutilizzo.

Separare i flussi di dati della trasformazione dei dati dai flussi di dati di staging/estrazione

Se un flusso di dati esegue tutte le azioni, è difficile riutilizzare le tabelle in altri flussi di dati o per altri scopi. I flussi di dati migliori da riutilizzare sono i flussi di dati che eseguono solo alcune azioni. La creazione di flussi di dati specializzati in un'attività specifica è uno dei modi migliori per riutilizzarli. Se si dispone di un set di flussi di dati usati come flussi di dati di staging, l'unica azione consiste nell'estrarre i dati così come sono dal sistema di origine. Questi flussi di dati possono essere riutilizzati in più altri flussi di dati.

Se sono presenti flussi di dati di trasformazione dei dati, è possibile suddividerli in flussi di dati che eseguono trasformazioni comuni. Ogni flusso di dati può eseguire solo alcune azioni. Queste poche azioni per flusso di dati assicurano che l'output di tale flusso di dati sia riutilizzabile da altri flussi di dati.

Dataflow doing only a few actions.

Immagine con dati estratti da un'origine dati a flussi di dati di staging, in cui le tabelle vengono archiviate in Dataverse o In Azure Data Lake Storage. I dati vengono quindi spostati nei flussi di dati di trasformazione in cui i dati vengono trasformati e convertiti nella struttura del data warehouse. Infine, i dati vengono caricati in un modello semantico di Power BI.

Usare più aree di lavoro

Ogni area di lavoro (o ambiente) è disponibile solo per i membri dell'area di lavoro. Se si compilano tutti i flussi di dati in un'area di lavoro, si riduce al minimo il riutilizzo dei flussi di dati. È possibile avere alcune aree di lavoro generiche per i flussi di dati che elaborano tabelle a livello aziendale. È anche possibile avere un'area di lavoro per i flussi di dati per elaborare tabelle in più reparti. È anche possibile avere alcune aree di lavoro per i flussi di dati da usare solo in reparti specifici.

Image showing the separate workspaces.

Impostare i livelli di accesso corretti nelle aree di lavoro

Per concedere l'accesso ai flussi di dati in altre aree di lavoro per usare l'output di un flusso di dati in un'area di lavoro, è sufficiente concedere l'accesso alla visualizzazione nell'area di lavoro. Per altre informazioni sugli altri ruoli in un'area di lavoro di Power BI, passare a Ruoli nelle nuove aree di lavoro.

Screenshot showing how to access to the Power BI workspace.

Verifica dell'autenticità del flusso di dati in Power BI

In un'organizzazione tenant possono essere creati molti flussi di dati e può risultare difficile sapere quale flusso di dati è più affidabile. Gli autori di un flusso di dati, o gli utenti che hanno accesso alla modifica, possono approvare il flusso di dati a tre livelli: nessuna verifica dell'autenticità, alzata di livello o certificata.

Questi livelli di verifica dell'autenticità consentono agli utenti di trovare flussi di dati affidabili più semplici e veloci. Il flusso di dati con un livello di verifica dell'autenticità superiore viene visualizzato per primo. L'amministratore di Power BI può delegare la possibilità di approvare i flussi di dati al livello certificato ad altre persone. Altre informazioni: Approvazione - Promozione e certificazione del contenuto di Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Separare le tabelle in più flussi di dati

È possibile avere più tabelle in un flusso di dati. Uno dei motivi per cui è possibile suddividere le tabelle in più flussi di dati è quello appreso in precedenza in questo articolo sulla separazione dei flussi di dati di inserimento dati e trasformazione dei dati. Un altro motivo valido per fare in modo che le tabelle in più flussi di dati siano quando si desidera una pianificazione dell'aggiornamento diversa rispetto ad altre tabelle.

Nell'esempio illustrato nell'immagine seguente, la tabella sales deve essere aggiornata ogni quattro ore. La tabella data deve essere aggiornata solo una volta al giorno per mantenere aggiornato il record di data corrente. E una tabella di mapping del prodotto deve essere aggiornata solo una volta alla settimana. Se tutte queste tabelle sono presenti in un flusso di dati, è disponibile solo un'opzione di aggiornamento per tutte. Tuttavia, se si suddivideno queste tabelle in più flussi di dati, è possibile pianificare l'aggiornamento di ogni flusso di dati separatamente.

Image showing dataflows with different schedules for the refresh.

Buoni candidati alla tabella per le tabelle del flusso di dati

Quando si sviluppano soluzioni usando Power Query negli strumenti desktop, è possibile chiedersi se stessi; quale di queste tabelle è un buon candidato per essere spostato in un flusso di dati? Le tabelle migliori da spostare nel flusso di dati sono quelle tabelle che devono essere usate in più di una soluzione o più di un ambiente o di un servizio. Ad esempio, la tabella Date illustrata nell'immagine seguente deve essere usata in due file di Power BI separati. Anziché duplicare tale tabella in ogni file, è possibile compilare la tabella in un flusso di dati come tabella e riutilizzarla in tali file di Power BI.

Image showing a shared table used in a dataflow.