Les på engelsk

Del via


Tabeller i datalager i Microsoft Fabric

Gjelder for:✅ Lager i Microsoft Fabric

Denne artikkelen beskriver viktige konsepter for utforming av tabeller i Microsoft Fabric.

I tabeller er data logisk organisert i et rad-og-kolonne-format. Hver rad representerer en unik post, og hver kolonne representerer et felt i posten.

  • I Warehouse er tabeller databaseobjekter som inneholder alle transaksjonsdataene.

Bestemme tabellkategori

Et stjerneskjema organiserer data i faktatabeller og dimensjonstabeller. Noen tabeller brukes til integrering eller oppsamling av data før du flytter til en fakta- eller dimensjonstabell. Når du utformer en tabell, må du bestemme om tabelldataene hører til i en fakta-, dimensjons- eller integreringstabell. Denne beslutningen informerer riktig tabellstruktur.

  • Faktatabeller inneholder kvantitative data som vanligvis genereres i et transaksjonssystem, og deretter lastes inn i datalageret. En detaljhandel genererer for eksempel salgstransaksjoner hver dag, og laster deretter inn dataene i en faktatabell for datalager for analyse.

  • Dimensjonstabeller inneholder attributtdata som kan endres, men som vanligvis endres sjelden. En kundes navn og adresse lagres for eksempel i en dimensjonstabell og oppdateres bare når kundens profil endres. Hvis du vil minimere størrelsen på en stor faktatabell, trenger ikke kundens navn og adresse å være i hver rad i en faktatabell. I stedet kan faktatabellen og dimensjonstabellen dele en kunde-ID. En spørring kan bli med i de to tabellene for å knytte en kundes profil og transaksjoner.

  • Integreringstabeller er et sted der du kan integrere eller sette opp data. Du kan for eksempel laste inn data til en oppsamlingstabell, utføre transformasjoner på dataene i oppsamling og deretter sette inn dataene i en produksjonstabell.

En tabell lagrer data i OneLake som en del av lageret. Tabellen og dataene vedvarer uansett om en økt er åpen eller ikke.

Tabeller i lageret

Hvis du vil vise organisasjonen av tabellene, kan du bruke fact, dimeller int som prefikser til tabellnavnene. Tabellen nedenfor viser noen av skjema- og tabellnavnene for eksempeldatalageret WideWorldImportersDW .

Navn på WideWorldImportersDW-kildetabell Tabelltype Tabellnavn for datalager
City Dimensjon wwi.DimCity
Ordne Fakta wwi.FactOrder
  • Det skilles mellom små og store bokstaver i tabellnavn.
  • Tabellnavn kan ikke inneholde / eller \ slutte med en ..

Opprett en tabell

For Warehouse kan du opprette en tabell som en ny tom tabell. Du kan også opprette og fylle ut en tabell med resultatene av en utvalgt setning. Nedenfor finner du T-SQL-kommandoene for å opprette en tabell.

T-SQL-setning Bekrivelse
OPPRETT TABELL Oppretter en tom tabell ved å definere alle tabellkolonnene og alternativene.
OPPRETT TABELL SOM UTVALG Fyller ut en ny tabell med resultatene av en utvalgt setning. Tabellkolonnene og datatypene er basert på resultatene fra utvalgssetningen. Hvis du vil importere data, kan denne setningen velge fra en ekstern tabell.

Dette eksemplet oppretter en tabell med to kolonner:

CREATE TABLE MyTable (col1 int, col2 int );  

Skjemanavn

Lageret støtter oppretting av egendefinerte skjemaer. På samme måte som i SQL Server er skjemaer en god måte å gruppere sammen objekter som brukes på en lignende måte. Følgende kode oppretter et brukerdefinert skjema kalt wwi.

  • Skjemanavn skiller mellom store og små bokstaver.
  • Skjemanavn kan ikke inneholde / eller \ slutte med en ..
CREATE SCHEMA wwi;

Datatyper

Microsoft Fabric støtter de mest brukte T-SQL-datatypene.

Sortering

Latin1_General_100_BIN2_UTF8 For øyeblikket er standard og bare støttet sortering for både tabeller og metadata.

Statistikk

Spørringsoptimalisering bruker statistikk på kolonnenivå når den oppretter planen for kjøring av en spørring. For å forbedre spørringsytelsen er det viktig å ha statistikk på individuelle kolonner, spesielt kolonner som brukes i spørringskoblinger. Warehouse støtter automatisk oppretting av statistikk.

Statistisk oppdatering skjer ikke automatisk. Oppdater statistikk etter at et betydelig antall rader er lagt til eller endret. Oppdater for eksempel statistikk etter en innlasting. Hvis du vil ha mer informasjon, kan du se Statistikk.

Primærnøkkel, sekundærnøkkel og unik nøkkel

For Warehouse støttes PRIMÆRNØKKEL og UNIK-begrensning bare når NONCLUSTERED og NOT ENFORCED brukes.

SEKUNDÆRNØKKEL støttes bare når IKKE FREMTVUNGET brukes.

Justere kildedata med datalageret

Lagertabeller fylles ut ved å laste inn data fra en annen datakilde. Hvis du vil oppnå en vellykket innlasting, må antallet og datatypene for kolonnene i kildedataene justeres etter tabelldefinisjonen i datalageret.

Hvis data kommer fra flere datalagre, kan du overføre dataene til datalageret og lagre dem i en integreringstabell. Når dataene er i integreringstabellen, kan du bruke kraften i datalageret til å implementere transformasjonsoperasjoner. Når dataene er klargjort, kan du sette dem inn i produksjonstabeller.

Begrensninger

Lageret støtter mange, men ikke alle, av tabellfunksjonene som tilbys av andre databaser.

Listen nedenfor viser noen av tabellfunksjonene som for øyeblikket ikke støttes.

  • Maksimalt 1024 kolonner per tabell
  • Beregnede kolonner
  • Indekserte visninger
  • Partisjonerte tabeller
  • Forløp
  • Sparsomme kolonner
  • Surrogatnøkler i nummerserier med identitetskolonner
  • Synonymer
  • midlertidige tabeller
  • Utløsere
  • Unike indekser
  • Brukerdefinerte typer

Viktig

Det finnes begrensninger ved å legge til tabellbetingelser eller kolonner når du bruker Kildekontroll med Lager.