Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Questa pagina fornisce indicazioni chiare e di opinione per gestire in modo efficiente i dati in Power BI e Azure Databricks per ottimizzare le prestazioni delle query e creare dashboard efficienti.
Per un set di guide introduttive pratiche che illustrano le implementazioni di riferimento di alcune delle procedure consigliate per l'uso di Power BI in Azure Databricks, vedere questo repository.
Connettere Azure Databricks e Power BI
| Procedura consigliata | Impatto | Docs |
|---|---|---|
| Usare i parametri di Power BI per la connessione a ambienti Azure Databricks diversi | Consente flessibilità durante la connessione a diversi spazi di lavoro di Azure Databricks o a diversi Azure Databricks SQL warehouse. | |
| Usare la funzionalità di pubblicazione di Azure Databricks nel servizio Power BI | Consente l'integrazione del catalogo e la sincronizzazione dei modelli di dati senza uscire dall'interfaccia utente di Azure Databricks. | |
| Usare la pubblicazione automatica di Azure Databricks in Power BI | Pubblicare set di dati da Unity Catalog a Power BI direttamente dalle pipeline di dati. |
Scegliere la modalità di archiviazione più appropriata
| Procedura consigliata | Impatto | Docs |
|---|---|---|
| Usare DirectQuery per le tabelle Fact e Dual per le tabelle delle dimensioni (non importare) | Generare query SQL più efficienti usando la modalità di archiviazione più adatta. | |
| Preferire DirectQuery rispetto all'importazione quando possibile | Consente di mantenere la governance e l'auditabilità. | |
| Usare modelli compositi per le modalità di archiviazione mista | Consente l'utilizzo misto di tabelle DirectQuery, Dual, Import, Aggregazione e tabelle Ibride. |
|
| Usare tabelle ibride per dati cronologici aggregati con dati in tempo reale | Abilita query in memoria efficienti. |
Ottimizzare l'accesso ai dati
| Procedura consigliata | Impatto | Docs |
|---|---|---|
| Usare le aggregazioni definite dall'utente | Migliora le prestazioni delle query su modelli semantici DirectQuery di grandi dimensioni memorizzando nella cache i dati preaggregati. | |
| Usare le aggregazioni automatiche | Ottimizza continuamente i modelli semantici DirectQuery creando aggregazioni basate sulla cronologia query per ottenere prestazioni massime del report. | |
| Usare il partizionamento delle tabelle o l'aggiornamento incrementale | Consente di importare i dati più velocemente e di gestire set di dati di dimensioni maggiori, soprattutto per report molto piccoli, statici e sensibili alle prestazioni (meno di 2 secondi). | |
| Aggiungi Applica tutti i filtri dei dati e Cancella tutti i pulsanti dei filtri dei dati | Impedisce le query non necessarie sfruttando le impostazioni di riduzione delle query quando gli utenti interagiscono con i filtri del report. | |
| Usare Assume integrità referenziale durante la definizione delle relazioni tra tabelle se l'integrità referenziale è stata convalidata nell'inserimento upstream | Consente strategie di join più efficienti nelle query SQL. | |
Per DirectQuery, controllare le impostazioni di configurazione della parallelizzazione delle query e le proprietà seguenti dei modelli semantici di Power BI:
|
Migliora la parallelizzazione delle query e ottimizza l'utilizzo di SQL Warehouse per migliorare le prestazioni complessive. |
Ottimizzare il modello di dati
| Procedura consigliata | Impatto | Docs |
|---|---|---|
| Trasformazioni "Sposta a sinistra" | Avvicinare la logica di business centrale alle fonti dati in modo che i dati siano di qualità superiore, più veloci e meno costosi da utilizzare. Le viste SQL sfruttano la potenza del motore SQL di Databricks per un'esecuzione più efficiente dei report rispetto alle trasformazioni PowerQuery e alle formule DAX. | |
| Se è necessario usare formule DAX, ottimizzare le formule DAX ed evitare set di risultati di grandi dimensioni. | Impedisce calcoli inefficienti che comportano un peggioramento delle prestazioni | |
| Evitare l'uso di colonne calcolate DAX e di tabelle calcolate nei modelli semantici e definire questi dati direttamente nelle vostre tabelle Gold. | Le misure pre-calcolate offrono prestazioni ottimali nel livello Gold | |
| Sfruttare l'intelligenza temporale basata su calendario | I modelli semantici DirectQuery possono eseguire calcoli di intelligenza temporale in modo molto più efficiente, consentendo report più veloci e scalabili. |
Monitorare le prestazioni e le metriche
| Procedura consigliata | Impatto | Docs |
|---|---|---|
| Usare Power BI Performance Analyzer per esaminare le prestazioni degli elementi del report | Identifica la visualizzazione che richiede più tempo per il caricamento e la posizione in cui si trova il collo di bottiglia. |