Tabeller i datawarehousing i Microsoft Fabric

Gælder for: Warehouse i Microsoft Fabric

I denne artikel beskrives de vigtigste begreber i forbindelse med design af tabeller i Microsoft Fabric.

I tabeller er data logisk organiseret i række- og kolonneformat. Hver række repræsenterer en entydig post, og hver kolonne repræsenterer et felt i posten.

  • I Warehouse er tabeller databaseobjekter, der indeholder alle transaktionsdataene.

Vigtigt

Microsoft Fabric fås som prøveversion.

Bestem tabelkategori

Et stjerneskema organiserer data i fakta- og dimensionstabeller. Nogle tabeller bruges til integration eller midlertidig lagring af data, før de flyttes til en fakta- eller dimensionstabel. Når du designer en tabel, skal du beslutte, om tabeldataene hører til en fakta-, dimensions- eller integrationstabel. Denne beslutning informerer den relevante tabelstruktur.

  • Faktatabeller indeholder kvantitative data, der ofte genereres i et transaktionssystem og derefter indlæses i data warehouse. En detailforretning genererer f.eks. salgstransaktioner hver dag og indlæser derefter dataene i en faktatabel for data warehouse til analyse.

  • Dimensionstabeller indeholder attributdata, der kan ændres, men som regel sjældent ændres. En kundes navn og adresse gemmes f.eks. i en dimensionstabel og opdateres kun, når kundens profil ændres. For at minimere størrelsen på en stor faktatabel behøver kundens navn og adresse ikke at være i hver række i en faktatabel. Faktatabellen og dimensionstabellen kan i stedet dele et kunde-id. En forespørgsel kan joinforbinde de to tabeller for at knytte en kundes profil og transaktioner.

  • Integrationstabeller giver mulighed for at integrere eller gemme data. Du kan f.eks. indlæse data i en midlertidig tabel, udføre transformationer på dataene i midlertidig lagring og derefter indsætte dataene i en produktionstabel.

En tabel gemmer data i OneLake-oversigten som en del af lageret. Tabellen og dataene bevares, uanset om en session er åben eller ej.

Tabeller i lageret

Hvis du vil have vist organiseringen af tabellerne, kan du bruge fact, dimeller int som præfiks til tabelnavnene. I følgende tabel vises nogle af skemaet og tabelnavnene for WideWorldImportersDW-eksempeldata warehouse.

Navn på WideWorldImportersDW-kildetabel Tabeltype Data Warehouse tabelnavn
City Dimension wwi.DimCity
Ordre Fakta wwi.FactOrder
  • Der skelnes mellem store og små bogstaver i tabelnavne.
  • Tabelnavne må ikke indeholde / eller \.

Opret en tabel

For Warehouse kan du oprette en tabel som en ny tom tabel. Du kan også oprette og udfylde en tabel med resultaterne af en select-sætning. Følgende er T-SQL-kommandoerne til oprettelse af en tabel.

T-SQL-sætning Beskrivelse
OPRET TABEL Opretter en tom tabel ved at definere alle tabelkolonnerne og -indstillingerne.
OPRET TABEL SOM VÆLG Udfylder en ny tabel med resultaterne af en select-sætning. Tabelkolonnerne og datatyperne er baseret på resultaterne af select-sætningen. Hvis du vil importere data, kan denne sætning vælge fra en ekstern tabel.

I dette eksempel oprettes en tabel med to kolonner:

CREATE TABLE MyTable (col1 int, col2 int );  

Skemanavne

Warehouse understøtter oprettelse af brugerdefinerede skemaer. Som i SQL Server er skemaer en god måde at gruppere objekter på, der bruges på samme måde. Følgende kode opretter et brugerdefineret skema med navnet wwi.

CREATE SCHEMA wwi;

Datatyper

Microsoft Fabric understøtter de mest anvendte T-SQL-datatyper.

Sortering

Latin1_General_100_BIN2_UTF8 Er i øjeblikket standarden og kun understøttet sortering for både tabeller og metadata.

Statistik

Forespørgselsoptimeringsprogrammet bruger statistik på kolonneniveau, når den opretter planen for udførelse af en forespørgsel. For at forbedre ydeevnen af forespørgsler er det vigtigt at have statistikker over individuelle kolonner, især kolonner, der bruges i forespørgselsjoinforbindelser. Lageret understøtter automatisk oprettelse af statistikker.

Statistisk opdatering sker ikke automatisk. Opdater statistik, når et betydeligt antal rækker tilføjes eller ændres. Opdater f.eks. statistikker efter en belastning. Du kan finde flere oplysninger under Statistik.

Primær nøgle, fremmed nøgle og entydig nøgle

For warehouse understøttes begrænsningen PRIMARY KEY og UNIQUE kun, når både NONCLUSTERED og NOT ENFORCED bruges.

FREMMED NØGLE understøttes kun, når NOT ENFORCED bruges.

Juster kildedata i forhold til data warehouse

Lagertabeller udfyldes ved at indlæse data fra en anden datakilde. For at opnå en vellykket indlæsning skal antallet og datatyperne for kolonnerne i kildedataene være i overensstemmelse med tabeldefinitionen i data warehouse.

Hvis data kommer fra flere datalagre, kan du overføre dataene til data warehouse og gemme dem i en integrationstabel. Når dataene er i integrationstabellen, kan du bruge styrken i data warehouse til at implementere transformationshandlinger. Når dataene er forberedt, kan du indsætte dem i produktionstabeller.

Begrænsninger

Warehouse understøtter mange, men ikke alle, tabelfunktioner, der tilbydes af andre databaser.

På følgende liste vises nogle af de tabelfunktioner, der ikke understøttes i øjeblikket. Denne liste kan ændres under prøveversionen.

  • Beregnede kolonner
  • Indekserede visninger
  • Sekvens
  • Sparsomme kolonner
  • Surrogatnøgler på nummerserier med identitetskolonner
  • Synonymer
  • Udløsere
  • Entydige indeks
  • Brugerdefinerede typer
  • Midlertidige tabeller

Næste trin