Zdieľať cez


Tabuľky v sklade údajov v službe Microsoft Fabric

Vzťahuje sa na:✅ Warehouse v službe Microsoft Fabric

V tomto článku sa uvádzajú podrobnosti o kľúčových konceptoch navrhovania tabuliek v službe Microsoft Fabric.

V tabuľkách sú údaje logicky usporiadané vo formáte riadkov a stĺpcov. Každý riadok predstavuje jedinečný záznam a každý stĺpec predstavuje pole v zázname.

  • V sklade sú tabuľky objektmi databázy, ktoré obsahujú všetky údaje o transakciách.

Určenie kategórie tabuľky

Hviezdicová schéma usporadúva údaje do tabuliek faktov a tabuliek dimenzií. Niektoré tabuľky sa používajú na integráciu alebo spájanie údajov pred prechodom na tabuľku faktov alebo dimenzií. Pri navrhovaní tabuľky sa rozhodnite, či údaje tabuľky patria do tabuľky faktov, dimenzií alebo tabuľky integrácie. Toto rozhodnutie informuje príslušnú štruktúru tabuľky.

  • Tabuľky faktov obsahujú kvantitatívne údaje, ktoré sa bežne generujú v transakačnom systéme a potom sa načítajú do skladu údajov. Napríklad obchod vygeneruje predajné transakcie každý deň a potom načíta údaje do tabuľky faktov skladu údajov na analýzu.

  • Tabuľky dimenzií obsahujú údaje atribútov, ktoré sa môžu meniť, ale zvyčajne sa menia zriedkavo. Napríklad meno a adresa zákazníka sú uložené v tabuľke dimenzií a aktualizujú sa iba v prípade zmeny profilu zákazníka. Na minimalizovanie veľkosti veľkej tabuľky faktov meno zákazníka a adresa nemusia byť v každom riadku tabuľky faktov. Namiesto toho môžu tabuľka faktov a tabuľka dimenzií zdieľať ID zákazníka. Dotaz môže spojiť dve tabuľky a priradiť profil zákazníka a transakcie.

  • Integračné tabuľky poskytujú miesto na integráciu alebo spájanie údajov. Môžete napríklad načítať údaje do prechodnej tabuľky, vykonávať transformácie na údajoch v rámci pracovnej verzie a potom vložiť údaje do produkčnej tabuľky.

Tabuľka ukladá údaje v službe OneLake ako súčasť služby Warehouse. Tabuľka a údaje pretrvávajú, či je relácia otvorená alebo nie.

Tabuľky v sklade

Ak chcete zobraziť organizáciu tabuliek, môžete použiť factpredpony , dimalebo int ako predpony k názvom tabuliek. V nasledujúcej tabuľke sú uvedené niektoré schémy a názvy tabuliek pre vzorový sklad údajov WideWorldImportersDW .

Názov zdrojovej tabuľky WideWorldImportersDW Typ tabuľky Názov tabuľky skladu údajov
City Rozmer wwi.DimCity
Poradie Fakt wwi.FactOrder
  • V názvoch tabuliek sa rozlišujú malé a veľké písmená.
  • Názvy tabuliek nemôžu obsahovať / , \ ani končiť reťazcom ..

Vytvorenie tabuľky

V prípade skladu môžete vytvoriť tabuľku ako novú prázdnu tabuľku. Tabuľku môžete tiež vytvoriť a vyplniť výsledkami príkazu select. Nižšie sú uvedené príkazy T-SQL na vytvorenie tabuľky.

Príkaz T-SQL Description
VYTVORENIE TABUĽKY Vytvorí prázdnu tabuľku definovaním všetkých stĺpcov tabuľky a možností.
VYTVORENIE TABUĽKY PO VÝBERE Vyplní novú tabuľku výsledkami príkazu select. Stĺpce tabuľky a typy údajov sú založené na výsledkoch príkazu select. Ak chcete importovať údaje, tento príkaz môže vybrať z externej tabuľky.

V tomto príklade sa vytvorí tabuľka s dvomi stĺpcami:

CREATE TABLE MyTable (col1 int, col2 int );  

Názvy schém

Warehouse podporuje vytváranie vlastných schém. Podobne ako v prípade SQL Servera, schémy sú dobrým spôsobom ako zoskupiť objekty, ktoré sa používajú podobným spôsobom. Nasledujúci kód vytvorí schému definovanú používateľom s názvom wwi.

  • V názvoch schém sa rozlišujú malé a veľké písmená.
  • Názvy schém nemôžu obsahovať / , ani \ končiť reťazcom ..
CREATE SCHEMA wwi;

Typy údajov

Microsoft Fabric podporuje najčastejšie používané typy údajov T-SQL.

Zoradenie

Latin1_General_100_BIN2_UTF8 V súčasnosti je predvolená a podporovaná iba zoradenie pre tabuľky aj metaúdaje.

Štatistika

Optimalizácia dotazu používa štatistiky na úrovni stĺpca pri vytváraní plánu na vykonanie dotazu. Ak chcete zlepšiť výkon dotazu, je dôležité mať štatistiky jednotlivých stĺpcov, najmä stĺpcov používaných v spojeniach dotazov. Sklad podporuje automatické vytváranie štatistík.

Štatistická aktualizácia sa nespusťuje automaticky. Aktualizujte štatistiku po pridaní alebo zmene značného počtu riadkov. Môžete napríklad po načítaní aktualizovať štatistiky. Ďalšie informácie nájdete v téme Štatistika.

Hlavný kľúč, cudzí kľúč a jedinečný kľúč

Pre sklad sa primárny kľúč a jedinečné obmedzenie podporujú len vtedy, keď sa použijú funkcie NONCLUSTERED aj NOT ENFORCED.

Cudzí kľúč je podporovaný len pri použití NOT ENFORCED.

Zarovnanie zdrojových údajov so skladom údajov

Tabuľky v sklade sa vyplnia načítaním údajov z iného zdroja údajov. Ak chcete dosiahnuť úspešné načítanie, počet a typy údajov stĺpcov v zdrojových údajoch sa musia zosúladiť s definíciou tabuľky v sklade údajov.

Ak údaje pochádzajú z viacerých úložiska údajov, môžete preniesť údaje do skladu údajov a uložiť ich v tabuľke integrácie. Keď sa údaje nachádzajú v tabuľke integrácie, môžete použiť silu skladu údajov na implementáciu operácií transformácie. Po pripravení údajov ich môžete vložiť do produkčných tabuliek.

Obmedzenia

Sklad podporuje mnoho (ale nie všetky) funkcií tabuľky, ktoré ponúkajú iné databázy.

V nasledujúcom zozname sú uvedené niektoré funkcie tabuľky, ktoré momentálne nie sú podporované.

  • Max. 1024 stĺpcov na tabuľku
  • Vypočítané stĺpce
  • Indexované zobrazenia
  • Rozdelených tabuliek
  • Sequence
  • Riedke stĺpce
  • Náhradné kľúče v číselných postupnostiach so stĺpcami identity
  • Synonymá
  • Dočasné tabuľky
  • Spúšťače
  • Jedinečné indexy
  • Používateľom definované typy

Dôležité

Pri používaní ovládacieho prvku Zdroj so skladom existujú obmedzenia týkajúce sa pridávania obmedzení tabuľky alebo stĺpcov.