Progettazione dello schema star
È insolito che un modello semantico di Power BI sia costituito da una singola tabella. Un modello a tabella singola può essere un progetto semplice, ad esempio adatto a un'attività di esplorazione dei dati o un modello di verifica, ma può non rappresentare una progettazione ottimale del modello. Un modello ottimale rispetta i principi di progettazione dello schema star. Lo schema star si riferisce a un approccio di progettazione comunemente usato dai progettisti di data warehouse relazionali perché presenta una struttura semplice da usare e supporta query di analisi a prestazioni elevate.
Questo principio di progettazione viene definito schema star perché classifica le tabelle del modello come tabella dei fatti o tabella delle dimensioni. In un diagramma, la tabella dei fatti è al centro della stella, mentre le tabelle delle dimensioni, se posizionate intorno a una tabella dei fatti, rappresentano i punti della stella.
Tabelle dei fatti
Il ruolo di una tabella dei fatti è quello di archiviare un accumulo di righe che rappresentano osservazioni o eventi che registrano un'attività di business specifica. Gli eventi archiviati in una tabella dei fatti delle vendite, ad esempio, possono essere ordini di vendita e righe dell'ordine. È anche possibile usare una tabella dei fatti per registrare i movimenti merce, scorte di magazzino o i tassi di cambio di valuta giornalieri. In genere, le tabelle dei fatti contengono diverse righe. Con il passare del tempo, le righe della tabella dei fatti si accumulano. Nelle query analitiche, che verranno definite più avanti in questo modulo, i dati della tabella dei fatti vengono riepilogati per produrre valori quali vendite e quantità.
Tabelle delle dimensioni
Le tabelle delle dimensioni descrivono le entità business, che in genere rappresentano persone, luoghi, prodotti o concetti. Una tabella delle dimensioni delle date, che contiene una riga per ogni data, è un esempio comune di tabella delle dimensioni concettuale. Le colonne nelle tabelle delle dimensioni consentono di filtrare e raggruppare i dati della tabella dei fatti.
Ogni tabella delle dimensioni deve avere una colonna univoca, denominata colonna chiave. Una colonna univoca non contiene valori duplicati e non deve mai avere valori mancanti. In una tabella delle dimensioni dei prodotti la colonna può essere denominata ProductKey o ProductID. Probabilmente, le colonne aggiuntive archivieranno i valori descrittivi, ad esempio il nome del prodotto, la sottocategoria, la categoria, il colore e così via. Nelle query analitiche queste colonne vengono usate per filtrare e raggruppare i dati.
Confrontare le tabelle dei fatti e delle dimensioni
Nella figura seguente vengono confrontate le caratteristiche delle tabelle dei fatti e delle dimensioni.
Caratteristica | Tabella delle dimensioni | Tabella dei fatti |
---|---|---|
Scopo del modello | Archivia le entità business | Archivia eventi oppure osservazioni |
Struttura della tabella | Include una colonna chiave e colonne descrittive per i filtri e il raggruppamento | Include le colonne chiave delle dimensioni e le colonne di misura numerica che è possibile riepilogare |
Volume dei dati | In genere, contiene un minor numero di righe (rispetto alle tabelle dei fatti) | Può contenere numerose righe |
Scopo della query | Filtrare e raggruppare | Riepilogare |
Correlazione tra tabelle con schema star
Nel modello le tabelle delle dimensioni sono correlate alle tabelle dei fatti tramite relazioni uno-a-molti. Le relazioni consentono ai filtri e ai gruppi applicati alle colonne della tabella delle dimensioni di propagarsi alla tabella dei fatti. Questo modello di progettazione è comune.
Le tabelle delle dimensioni possono essere usate per filtrare più tabelle dei fatti e le tabelle dei fatti possono essere filtrate da più tabelle delle dimensioni. Tuttavia, non è consigliabile correlare una tabella dei fatti direttamente a un'altra tabella dei fatti.
Per mettere in pratica il concetto, scaricare il file Adventure Works DW 2020 M01.pbix, aprirlo e quindi passare al diagramma del modello.
Si noti che il modello è costituito da sette tabelle, una delle quali è denominata Sales ed è la tabella dei fatti. Le tabelle rimanenti sono tabelle delle dimensioni e sono denominate come segue:
- Cliente
- Data
- Product
- Reseller
- Ordine cliente
- Area di vendita
Si notino le relazioni tra le tabelle delle dimensioni e le tabelle dei fatti e che ogni direzione del filtro delle relazioni punta verso la tabella dei fatti. Di conseguenza, quando si applicano i filtri alle colonne della tabella delle dimensioni, per filtrare o raggruppare in base ai valori della colonna, i fatti correlati vengono filtrati e riepilogati.
Se si esamina il modello, è possibile vedere una forma a stella.
Per altre informazioni sulla progettazione basata sullo schema star, vedere Informazioni su uno schema star e sulla sua importanza per Power BI.