Descrivere i concetti di base della modellazione dei dati

Completato

I modelli analitici consentono di strutturare i dati per supportare l'analisi. I modelli sono basati su tabelle di dati correlate e definiscono i valori numerici da analizzare o segnalare (noti come misure) e le entità in base alle quali aggregarli (note come dimensioni). Un modello, ad esempio, può includere una tabella contenente le misure numeriche per le vendite (ad esempio, i ricavi o le quantità) e le dimensioni per i prodotti, i clienti e il tempo. Ciò consente di aggregare le misure di vendita su una o più dimensioni (ad esempio, per identificare i ricavi totali per cliente o il totale degli articoli venduti per prodotto al mese). Concettualmente, il modello forma una struttura multidimensionale, comunemente chiamata cubo, in cui ogni punto di intersezione delle dimensioni rappresenta una misura aggregata per tali dimensioni.

A conceptual view of an analytical data model as a cube with dimensions for Product, Customer, and Time dimensions. A specific intersection point in the cube contains total revenue for a specific product sold to a specific customer in a specific month.

Nota

Anche se comunemente ci si riferisce a un modello analitico come a un cubo, le dimensioni possono essere più (o meno) di tre, ma non è facile visualizzarne più di tre.

Tabelle e schema

Le tabelle delle dimensioni rappresentano le entità per le quali si vogliono aggregare le misure numeriche, ad esempio il prodotto o il cliente. Ogni entità è rappresentata da una riga con un valore chiave univoco. Le colonne rimanenti rappresentano gli attributi di un'entità: ad esempio, i prodotti hanno nomi e categorie, mentre i clienti hanno indirizzi e città. Nella maggior parte dei modelli analitici è comune includere una dimensione temporale, per poter aggregare le misure numeriche associate agli eventi nel tempo.

Le misure numeriche che verranno aggregate dalle varie dimensioni del modello sono archiviate nelle tabelle dei fatti. Ogni riga di una tabella dei fatti rappresenta un evento registrato a cui sono associate misure numeriche. La tabella Sales dello schema seguente, ad esempio, rappresenta le transazioni di vendita di singoli articoli e include valori numerici per la quantità venduta e i ricavi.

A schema of Customer, Product, and Time dimension tables related to a Sales fact table

Questo tipo di schema, in cui una tabella dei fatti è collegata a una o più tabelle delle dimensioni, viene definito schema star. Si immagini che ci siano cinque dimensioni correlate a una singola tabella dei fatti: lo schema formerebbe una stella (in inglese, star) a cinque punte. È anche possibile definire uno schema più complesso, in cui le tabelle delle dimensioni sono correlate a tabelle aggiuntive contenenti più dettagli. Ad esempio, si possono rappresentare gli attributi delle categorie di prodotti in una tabella Category separata, correlata alla tabella Product: in questo caso si parla di schema snowflake. Lo schema delle tabelle dei fatti e delle dimensioni viene usato per creare un modello analitico in cui le aggregazioni delle misure su tutte le dimensioni sono calcolate in anticipo, rendendo le attività di analisi e di creazione di report molto più veloci rispetto a dover calcolare le aggregazioni ogni volta.

Gerarchie di attributi

Un'ultima cosa che vale la pena di considerare nei modelli analitici è la creazione di gerarchie di attributi che consentono di eseguire rapidamente un drill-up o un drill-down per trovare valori aggregati a livelli diversi di una dimensione gerarchica. Si considerino, ad esempio, gli attributi delle tabelle delle dimensioni di cui si è parlato finora. Nella tabella Product è possibile formare una gerarchia in cui ogni categoria può includere più prodotti denominati. Allo stesso modo, nella tabella Customer, si può formare una gerarchia per rappresentare più clienti designati in ogni città. Infine, nella tabella Time, si può formare una gerarchia di anno, mese e giorno. Il modello può essere creato con valori pre-aggregati per ogni livello di una gerarchia, consentendo di modificare rapidamente l'ambito dell'analisi, ad esempio visualizzando le vendite totali per anno e quindi eseguendo il drill-down per visualizzare in maggior dettaglio le vendite totali per mese.

A hiererchy defined for the Year, Month, and Day attributes in a Time dimension results in measures being aggregated for each level of the hierarchy

Modellazione analitica in Microsoft Power BI

È possibile usare Power BI per definire un modello analitico da tabelle di dati, che possono essere importate da una o più origini dati. È quindi possibile usare l'interfaccia di modellazione dei dati nella scheda Modello di Power BI Desktop per definire il modello analitico creando relazioni tra tabelle dei fatti e delle dimensioni, definendo gerarchie, impostando tipi di dati e formati di visualizzazione per i campi nelle tabelle e gestendo altre proprietà dei dati che consentono di definire un modello avanzato per l'analisi.

The Model tab in Power BI Desktop