Descrizione delle tecniche di ottimizzazione del modello semantico
Un analista dei dati trascorre circa il 90% del proprio tempo a lavorare con i dati e, nove volte su dieci, i problemi di prestazioni sono dovuti direttamente a un modello semantico progettato in modo non appropriato, a calcoli DAX (Data Analysis Expressions) inefficienti o di una combinazione di questi due fattori. Il processo di progettazione di un modello semantico per garantire le prestazioni può essere noioso ed è spesso sottovalutato.
Tuttavia, se si risolvono i problemi di prestazioni durante lo sviluppo, si avrà un modello semantico affidabile che offrirà prestazioni di reporting migliori e un'esperienza utente complessivamente più positiva. In definitiva, ciò consentirà anche di mantenere prestazioni ottimizzate. Man mano che l'organizzazione cresce, aumentano le dimensioni dei dati e i modelli semantici diventano più complessi. Ottimizzando il modello semantico in anticipo, è possibile mitigare l'impatto negativo che questa crescita potrebbe avere sulle prestazioni del modello semantico stesso.
Un modello semantico di dimensioni più piccole usa meno risorse (memoria) e consente di eseguire più rapidamente l'aggiornamento dei dati, i calcoli e il rendering degli oggetti visivi nei report. Pertanto, il processo di ottimizzazione delle prestazioni implica la riduzione al minimo delle dimensioni del modello semantico e l'uso più efficiente dei dati nel modello. Le decisioni di progettazione dovrebbero:
- Assicurare l'uso dei tipi di dati corretti.
- Rimuovere colonne e righe non necessarie.
- Evitare la ripetizione di valori.
- Presentare colonne numeriche come misure.
- Ridurre la cardinalità delle colonne.
- Analizzare i metadati di modello.
- Riepilogare i dati ove possibile.
Ad esempio, supporre di lavorare come sviluppatore in Power BI per Tailwind Traders. Si è ricevuto l'incarico di rivedere un modello semantico creato alcuni anni fa da un altro sviluppatore, che nel frattempo ha lasciato l'organizzazione.
Il modello semantico produce un report che ha ricevuto feedback negativi dagli utenti. Gli utenti sono soddisfatti dei risultati che vedono nel report, ma non delle sue prestazioni. Il caricamento delle pagine del report richiede troppo tempo e le tabelle non si aggiornano abbastanza rapidamente quando si applicano nuovi filtri. Oltre a questi feedback, il team IT ha rilevato che la dimensione del file di questo particolare modello semantico è troppo grande e che sta mettendo a dura prova le risorse di capacità.
È necessario rivedere il modello semantico per identificare le cause principali dei problemi di prestazioni e apportare modifiche per ottimizzarle.