Læs på engelsk

Del via


Tabeller i datawarehousing i Microsoft Fabric

Gælder for:✅ Warehouse i Microsoft Fabric

I denne artikel beskrives de vigtigste begreber i forbindelse med design af tabeller i Microsoft Fabric.

I tabeller er data logisk organiseret i række- og kolonneformat. Hver række repræsenterer en entydig post, og hver kolonne repræsenterer et felt i posten.

  • I Warehouse er tabeller databaseobjekter, der indeholder alle transaktionsdata.

Bestem tabelkategori

Et stjerneskema organiserer data i faktatabeller og dimensionstabeller. Nogle tabeller bruges til integration eller lagring af data, før du flytter til en fakta- eller dimensionstabel. Når du designer en tabel, skal du beslutte, om tabeldataene tilhører en fakta-, dimensions- eller integrationstabel. Denne beslutning informerer den relevante tabelstruktur.

  • Faktatabeller indeholder kvantitative data, der ofte genereres i et transaktionssystem og derefter indlæses i data warehouse'et. En detailvirksomhed genererer f.eks. salgstransaktioner hver dag og indlæser derefter dataene i en faktatabel for data warehouse til analyse.

  • Dimensionstabeller indeholder attributdata, der kan ændres, men som regel sjældent ændres. En kundes navn og adresse gemmes f.eks. i en dimensionstabel og opdateres kun, når kundens profil ændres. Hvis du vil minimere størrelsen på en stor faktatabel, behøver kundens navn og adresse ikke at være i hver række i en faktatabel. I stedet kan faktatabellen og dimensionstabellen dele et kunde-id. En forespørgsel kan joinforbinde de to tabeller for at knytte en kundes profil og transaktioner.

  • Integrationstabeller giver mulighed for at integrere eller gemme data. Du kan f.eks. indlæse data i en midlertidig tabel, udføre transformationer af dataene i midlertidig lagring og derefter indsætte dataene i en produktionstabel.

En tabel gemmer data i OneLake som en del af lageret. Tabellen og dataene bevares, uanset om en session er åben eller ej.

Tabeller på lageret

Hvis du vil have vist organiseringen af tabellerne, kan du bruge fact, dimeller int som præfiks til tabelnavnene. I følgende tabel vises nogle af skemaet og tabelnavnene for WideWorldImportersDW-eksempeldata warehouse.

Navn på WideWorldImportersDW-kildetabel Tabeltype Tabelnavn for Data Warehouse
City Dimension wwi.DimCity
Ordre Fakta wwi.FactOrder
  • Der skelnes mellem store og små bogstaver i tabelnavne.
  • Tabelnavne må ikke indeholde / eller \ slutte med en ..

Opret en tabel

For Warehouse kan du oprette en tabel som en ny tom tabel. Du kan også oprette og udfylde en tabel med resultaterne af en select-sætning. Følgende er T-SQL-kommandoerne til oprettelse af en tabel.

T-SQL-sætning Beskrivelse
OPRET TABEL Opretter en tom tabel ved at definere alle tabelkolonner og -indstillinger.
OPRET TABEL SOM VÆLG Udfylder en ny tabel med resultaterne af en select-sætning. Tabelkolonnerne og datatyperne er baseret på resultaterne af select-sætningen. Hvis du vil importere data, kan denne sætning vælge fra en ekstern tabel.

I dette eksempel oprettes en tabel med to kolonner:

CREATE TABLE MyTable (col1 int, col2 int );  

Skemanavne

Lageret understøtter oprettelse af brugerdefinerede skemaer. Ligesom i SQL Server er skemaer en god måde at gruppere objekter på, der bruges på samme måde. Følgende kode opretter et brugerdefineret skema med navnet wwi.

  • Der skelnes mellem store og små bogstaver i skemanavne.
  • Skemanavne må ikke indeholde / eller \ slutte med en ..
CREATE SCHEMA wwi;

Datatyper

Microsoft Fabric understøtter de mest anvendte T-SQL-datatyper.

Sortering

Latin1_General_100_BIN2_UTF8 Er i øjeblikket standarden og kun understøttet sortering for både tabeller og metadata.

Statistik

Forespørgselsoptimering bruger statistik på kolonneniveau, når den opretter planen for udførelse af en forespørgsel. For at forbedre ydeevnen af forespørgsler er det vigtigt at have statistikker for individuelle kolonner, især kolonner, der bruges i forespørgselsjoinforbindelser. Lageret understøtter automatisk oprettelse af statistikker.

Statistisk opdatering sker ikke automatisk. Opdater statistik, når et betydeligt antal rækker er tilføjet eller ændret. Opdater f.eks. statistikker efter en indlæsning. se Statistik for at få flere oplysninger.

Primær nøgle, fremmed nøgle og entydig nøgle

For warehouse understøttes begrænsningen PRIMARY KEY og UNIQUE kun, når både NONCLUSTERED og NOT ENFORCED bruges.

FREMMED NØGLE understøttes kun, når DER bruges IKKE GENNEMTVUNGet.

Juster kildedata i forhold til data warehouse

Lagertabeller udfyldes ved at indlæse data fra en anden datakilde. Hvis du vil opnå en vellykket indlæsning, skal antallet og datatyperne for kolonnerne i kildedataene justeres i forhold til tabeldefinitionen i data warehouse'et.

Hvis data kommer fra flere datalagre, kan du overføre dataene til data warehouse'et og gemme dem i en integrationstabel. Når data er i integrationstabellen, kan du bruge styrken i data warehouse til at implementere transformationshandlinger. Når dataene er forberedt, kan du indsætte dem i produktionstabeller.

Begrænsninger

Warehouse understøtter mange, men ikke alle, tabelfunktioner, der tilbydes af andre databaser.

På følgende liste vises nogle af de tabelfunktioner, der ikke understøttes i øjeblikket.

  • 1024 maksimale kolonner pr. tabel
  • Beregnede kolonner
  • Indekserede visninger
  • Partitionerede tabeller
  • Sequence
  • Sparsomme kolonner
  • Surrogatnøgler på nummerserier med identitetskolonner
  • Synonymer
  • Midlertidige tabeller
  • Udløsere
  • Entydige indeks
  • Brugerdefinerede typer

Vigtigt

Der er begrænsninger ved tilføjelse af tabelbegrænsninger eller kolonner, når du bruger Versionsstyring med Warehouse.