Tabelle in data warehousing in Microsoft Fabric
Si applica a: Warehouse in Microsoft Fabric
Questo articolo illustra i concetti chiave per la progettazione di tabelle in Microsoft Fabric.
Nelle tabelle i dati sono organizzati logicamente in un formato di riga e colonna. Ogni riga rappresenta un record univoco e ogni colonna rappresenta un campo all'interno del record.
- In Warehouse le tabelle sono oggetti di database che contengono tutti i dati transazionali.
Importante
Microsoft Fabric è attualmente in ANTEPRIMA. Queste informazioni si riferiscono a un prodotto di versione preliminare che può essere modificato sostanzialmente prima che venga rilasciato. Microsoft non garantisce alcuna garanzia, espressa o implicita, rispetto alle informazioni fornite qui.
Determinare la categoria della tabella
Uno schema star organizza i dati in tabelle fact e tabelle delle dimensioni. Alcune tabelle vengono usate per l'integrazione o la gestione temporanea dei dati prima di passare a una tabella di fatti o dimensioni. Quando si progetta una tabella, occorre decidere se i dati appartengono a una tabella fact, delle dimensioni o di integrazione. Questa decisione informa la struttura della tabella appropriata.
Le tabelle dei fatti contengono dati quantitativi che vengono comunemente generati in un sistema transazionale e quindi caricati nel data warehouse. Un'azienda di vendita al dettaglio, ad esempio, genera quotidianamente transazioni di vendita e successivamente carica i dati in una tabella fact di data warehouse per analizzarli.
Le tabelle delle dimensioni contengono dati di attributo che potrebbero cambiare, ma in genere cambiano raramente. Il nome e l'indirizzo di un cliente, ad esempio, vengono archiviati in una tabella delle dimensioni e aggiornati solo quando viene modificato il profilo del cliente. Per ridurre al minimo le dimensioni di una tabella dei fatti di grandi dimensioni, si può evitare di inserire il nome e l'indirizzo del cliente in ogni riga della tabella. La tabella fact e la tabella delle dimensioni possono invece condividere un ID cliente. Una query può creare un join tra le due tabelle per associare il profilo e le transazioni di un cliente.
Le tabelle di integrazione sono un luogo in cui integrare o gestire temporaneamente i dati. È ad esempio possibile caricare i dati in una tabella di staging, eseguire trasformazioni sui dati in gestione temporanea e quindi inserirli in una tabella di produzione.
Una tabella archivia i dati in Una panoramica di OneLake come parte del Warehouse. La tabella e i dati persistono se una sessione è aperta o meno.
Tabelle nel warehouse
Per visualizzare l'organizzazione delle tabelle, è possibile usare fact
, dim
o int
come prefissi ai nomi delle tabelle. La tabella seguente mostra alcuni dei nomi di schema e tabella per WideWorldImportersDW data warehouse di esempio.
WideWorldImportersDW Nome tabella di origine | Tipo di tabella | Data Warehouse nome tabella |
---|---|---|
City | Dimensione | wwi.DimCity |
Ordine | Fact | wwi.FactOrder |
- I nomi delle tabelle sono distinzione tra maiuscole e minuscole.
- I nomi di tabella non possono contenere
/
o\
.
Creare una tabella
Per Warehouse è possibile creare una tabella come nuova tabella vuota. È inoltre possibile creare e popolare una tabella con i risultati di un'istruzione SELECT. Di seguito sono riportati i comandi T-SQL per la creazione di una tabella.
Istruzione T-SQL | Descrizione |
---|---|
CREATE TABLE | Crea una tabella vuota definendo tutte le opzioni e le colonne della tabella. |
CREATE TABLE AS SELECT | Popola una nuova tabella con i risultati di un'istruzione SELECT. Le colonne e i tipi di dati della tabella si basano sui risultati dell'istruzione SELECT. Per importare i dati, questa istruzione può selezionare da una tabella esterna. |
In questo esempio viene creata una tabella con due colonne:
CREATE TABLE MyTable (col1 int, col2 int );
Nomi di schemi.
Warehouse supporta la creazione di schemi personalizzati. Come in SQL Server, gli schemi sono un buon modo per raggruppare gli oggetti usati in modo simile. Il codice seguente crea uno schema definito dall'utente denominato wwi
.
CREATE SCHEMA wwi;
Tipi di dati
Microsoft Fabric supporta i tipi di dati T-SQL usati più comunemente.
- Per altre informazioni sui tipi di dati, vedere Tipi di dati in Microsoft Fabric.
- Quando si crea una tabella in Warehouse, esaminare i tipi di dati di riferimento in CREATE TABLE (Transact-SQL).
- Per una guida alla creazione di una tabella in Warehouse, vedere Creare tabelle.
Regole di confronto
Attualmente, Latin1_General_100_BIN2_UTF8
è le regole di confronto predefinite e supportate solo per le tabelle e i metadati.
Statistiche
Quando crea il piano per l'esecuzione di una query, Query Optimizer usa le statistiche a livello di colonna. Per migliorare le prestazioni delle query, è importante avere statistiche sulle singole colonne, in particolare le colonne usate nei join di query. Warehouse supporta la creazione automatica delle statistiche.
L'aggiornamento statistico non viene eseguito automaticamente. Aggiornare le statistiche dopo l'aggiunta o la modifica di un numero significativo di righe. Ad esempio, aggiornare le statistiche dopo un carico. Per altre informazioni, vedere l'articolo relativo alle statistiche.
Chiave primaria, chiave esterna e chiave univoca
Per Warehouse, i vincoli PRIMARY KEY e UNIQUE sono supportati solo quando vengono usati SIA NONCLUSTERED che NOT ENFORCED.
FOREIGN KEY è supportato solo quando viene usato NOT ENFORCED.
- Per la sintassi, selezionare ALTER TABLE.
- Per altre informazioni, vedere Chiavi primarie, chiavi esterne e chiavi univoce in Warehouse in Microsoft Fabric.
Allineare i dati di origine al data warehouse
Le tabelle del warehouse vengono popolate caricando i dati da un'altra origine dati. Per ottenere un carico riuscito, il numero e i tipi di dati delle colonne nei dati di origine devono essere allineati alla definizione della tabella nel data warehouse.
Se i dati provengono da più archivi dati, è possibile trasferire i dati nel data warehouse e archiviarlo in una tabella di integrazione. Una volta che i dati si trovano nella tabella di integrazione, è possibile usare la potenza del data warehouse per implementare le operazioni di trasformazione. Dopo aver preparati i dati, è possibile inserirli nelle tabelle di produzione.
Limitazioni
Warehouse supporta molti, ma non tutti, delle funzionalità della tabella offerte da altri database.
L'elenco seguente mostra alcune delle funzionalità della tabella attualmente non supportate. Durante l'anteprima, questo elenco è soggetto a modifiche.
- Colonne calcolate
- Viste indicizzate
- Sequenza
- Colonne di tipo sparse
- Chiavi surrogate nelle sequenze di numeri con colonne Identity
- Sinonimi
- Trigger
- Indici univoci
- Tipi definiti dall'utente
- Tabelle temporanee