Tabeller i datawarehousing i Microsoft Fabric
Gælder for: Warehouse i Microsoft Fabric
I denne artikel beskrives de vigtigste begreber i forbindelse med design af tabeller i Microsoft Fabric.
I tabeller er data logisk organiseret i række- og kolonneformat. Hver række repræsenterer en entydig post, og hver kolonne repræsenterer et felt i posten.
- I Warehouse er tabeller databaseobjekter, der indeholder alle transaktionsdataene.
Vigtigt
Microsoft Fabric fås som prøveversion.
Bestem tabelkategori
Et stjerneskema organiserer data i fakta- og dimensionstabeller. Nogle tabeller bruges til integration eller midlertidig lagring af data, før de flyttes til en fakta- eller dimensionstabel. Når du designer en tabel, skal du beslutte, om tabeldataene hører til en fakta-, dimensions- eller integrationstabel. Denne beslutning informerer den relevante tabelstruktur.
Faktatabeller indeholder kvantitative data, der ofte genereres i et transaktionssystem og derefter indlæses i data warehouse. En detailforretning genererer f.eks. salgstransaktioner hver dag og indlæser derefter dataene i en faktatabel for data warehouse til analyse.
Dimensionstabeller indeholder attributdata, der kan ændres, men som regel sjældent ændres. En kundes navn og adresse gemmes f.eks. i en dimensionstabel og opdateres kun, når kundens profil ændres. For at minimere størrelsen på en stor faktatabel behøver kundens navn og adresse ikke at være i hver række i en faktatabel. Faktatabellen og dimensionstabellen kan i stedet dele et kunde-id. En forespørgsel kan joinforbinde de to tabeller for at knytte en kundes profil og transaktioner.
Integrationstabeller giver mulighed for at integrere eller gemme data. Du kan f.eks. indlæse data i en midlertidig tabel, udføre transformationer på dataene i midlertidig lagring og derefter indsætte dataene i en produktionstabel.
En tabel gemmer data i OneLake-oversigten som en del af lageret. Tabellen og dataene bevares, uanset om en session er åben eller ej.
Tabeller i lageret
Hvis du vil have vist organiseringen af tabellerne, kan du bruge fact
, dim
eller int
som præfiks til tabelnavnene. I følgende tabel vises nogle af skemaet og tabelnavnene for WideWorldImportersDW-eksempeldata warehouse.
Navn på WideWorldImportersDW-kildetabel | Tabeltype | Data Warehouse tabelnavn |
---|---|---|
City | Dimension | wwi.DimCity |
Ordre | Fakta | wwi.FactOrder |
- Der skelnes mellem store og små bogstaver i tabelnavne.
- Tabelnavne må ikke indeholde
/
eller\
.
Opret en tabel
For Warehouse kan du oprette en tabel som en ny tom tabel. Du kan også oprette og udfylde en tabel med resultaterne af en select-sætning. Følgende er T-SQL-kommandoerne til oprettelse af en tabel.
T-SQL-sætning | Beskrivelse |
---|---|
OPRET TABEL | Opretter en tom tabel ved at definere alle tabelkolonnerne og -indstillingerne. |
OPRET TABEL SOM VÆLG | Udfylder en ny tabel med resultaterne af en select-sætning. Tabelkolonnerne og datatyperne er baseret på resultaterne af select-sætningen. Hvis du vil importere data, kan denne sætning vælge fra en ekstern tabel. |
I dette eksempel oprettes en tabel med to kolonner:
CREATE TABLE MyTable (col1 int, col2 int );
Skemanavne
Warehouse understøtter oprettelse af brugerdefinerede skemaer. Som i SQL Server er skemaer en god måde at gruppere objekter på, der bruges på samme måde. Følgende kode opretter et brugerdefineret skema med navnet wwi
.
CREATE SCHEMA wwi;
Datatyper
Microsoft Fabric understøtter de mest anvendte T-SQL-datatyper.
- Du kan finde flere oplysninger om datatyper under Datatyper i Microsoft Fabric.
- Når du opretter en tabel i Warehouse, skal du gennemse referencen til datatyper i CREATE TABLE (Transact-SQL).
- Du kan finde en vejledning i at oprette en tabel i Warehouse under Opret tabeller.
Sortering
Latin1_General_100_BIN2_UTF8
Er i øjeblikket standarden og kun understøttet sortering for både tabeller og metadata.
Statistik
Forespørgselsoptimeringsprogrammet bruger statistik på kolonneniveau, når den opretter planen for udførelse af en forespørgsel. For at forbedre ydeevnen af forespørgsler er det vigtigt at have statistikker over individuelle kolonner, især kolonner, der bruges i forespørgselsjoinforbindelser. Lageret understøtter automatisk oprettelse af statistikker.
Statistisk opdatering sker ikke automatisk. Opdater statistik, når et betydeligt antal rækker tilføjes eller ændres. Opdater f.eks. statistikker efter en belastning. Du kan finde flere oplysninger under Statistik.
Primær nøgle, fremmed nøgle og entydig nøgle
For warehouse understøttes begrænsningen PRIMARY KEY og UNIQUE kun, når både NONCLUSTERED og NOT ENFORCED bruges.
FREMMED NØGLE understøttes kun, når NOT ENFORCED bruges.
- Hvis du vil have syntaks, skal du se ALTER TABLE.
- Du kan finde flere oplysninger under Primære nøgler, fremmede nøgler og entydige nøgler i Warehouse i Microsoft Fabric.
Juster kildedata i forhold til data warehouse
Lagertabeller udfyldes ved at indlæse data fra en anden datakilde. For at opnå en vellykket indlæsning skal antallet og datatyperne for kolonnerne i kildedataene være i overensstemmelse med tabeldefinitionen i data warehouse.
Hvis data kommer fra flere datalagre, kan du overføre dataene til data warehouse og gemme dem i en integrationstabel. Når dataene er i integrationstabellen, kan du bruge styrken i data warehouse til at implementere transformationshandlinger. Når dataene er forberedt, kan du indsætte dem i produktionstabeller.
Begrænsninger
Warehouse understøtter mange, men ikke alle, tabelfunktioner, der tilbydes af andre databaser.
På følgende liste vises nogle af de tabelfunktioner, der ikke understøttes i øjeblikket. Denne liste kan ændres under prøveversionen.
- Beregnede kolonner
- Indekserede visninger
- Sekvens
- Sparsomme kolonner
- Surrogatnøgler på nummerserier med identitetskolonner
- Synonymer
- Udløsere
- Entydige indeks
- Brugerdefinerede typer
- Midlertidige tabeller