Tabulky v datových skladech v Microsoft Fabric

Platí pro: Warehouse v Microsoft Fabric

Tento článek podrobně popisuje klíčové koncepty návrhu tabulek v Microsoft Fabric.

V tabulkách jsou data logicky uspořádaná ve formátu řádků a sloupců. Každý řádek představuje jedinečný záznam a každý sloupec představuje pole v záznamu.

  • Tabulky ve skladu jsou databázové objekty, které obsahují všechna transakční data.

Určení kategorie tabulky

Hvězdicové schéma uspořádá data do tabulek faktů a dimenzí. Některé tabulky se používají pro integraci nebo přípravná data před přechodem na tabulku faktů nebo dimenzí. Při návrhu tabulky se rozhodněte, jestli data tabulky patří do faktu, dimenze nebo integrační tabulky. Toto rozhodnutí informuje příslušnou strukturu tabulky.

  • Tabulky faktů obsahují kvantitativní data, která se běžně generují v transakčním systému, a pak se načtou do datového skladu. Například maloobchodní firma generuje prodejní transakce každý den a pak načte data do tabulky faktů datového skladu pro účely analýzy.

  • Tabulky dimenzí obsahují data atributů, která se můžou změnit, ale obvykle se mění jen zřídka. Například jméno a adresa zákazníka se ukládají v tabulce dimenzí a aktualizují se jenom v případě, že se profil zákazníka změní. Aby se minimalizovala velikost velké tabulky faktů, nemusí být jméno a adresa zákazníka na každém řádku tabulky faktů. Místo toho může tabulka faktů a tabulka dimenzí sdílet ID zákazníka. Dotaz může spojit dvě tabulky a přidružit profil a transakce zákazníka.

  • Integrační tabulky poskytují místo pro integraci nebo přípravu dat. Můžete například načíst data do pracovní tabulky, provést transformace dat v přípravné fázi a pak je vložit do produkční tabulky.

Tabulka ukládá data ve OneLake jako součást skladu. Tabulka a data se zachovají bez ohledu na to, jestli je relace otevřená.

Tabulky ve skladu

Pokud chcete zobrazit uspořádání tabulek, můžete použít factdim, nebo int jako předpony názvů tabulek. Následující tabulka uvádí některé názvy schémat a tabulek pro ukázkový datový sklad WideWorldImportersDW .

Název zdrojové tabulky WideWorldImportersDW Typ tabulky Název tabulky datového skladu
Město Dimenze wwi.DimCity
Objednávka Fakt wwi.FactOrder
  • U názvů tabulky se rozlišují velká a malá písmena.
  • Názvy tabulek nemůžou obsahovat / ani \ končit tečkou ..

Vytvoření tabulky

Pro Sklad můžete vytvořit tabulku jako novou prázdnou tabulku. Můžete také vytvořit a naplnit tabulku výsledky příkazu select. Následují příkazy T-SQL pro vytvoření tabulky.

Příkaz T-SQL Popis
CREATE TABLE Vytvoří prázdnou tabulku definováním všech sloupců a možností tabulky.
CREATE TABLE AS SELECT Naplní novou tabulku výsledky příkazu select. Sloupce tabulky a datové typy jsou založené na výsledcích příkazu select. Pokud chcete importovat data, můžete tento příkaz vybrat z externí tabulky.

Tento příklad vytvoří tabulku se dvěma sloupci:

CREATE TABLE MyTable (col1 int, col2 int );  

Názvy schématu

Warehouse podporuje vytváření vlastních schémat. Podobně jako v SQL Serveru jsou schémata dobrým způsobem, jak seskupit objekty, které se používají podobným způsobem. Následující kód vytvoří uživatelem definované schéma s názvem wwi.

  • V názvech schémat se rozlišují malá a velká písmena.
  • Názvy schémat nemohou obsahovat / ani \ končit písmenem ..
CREATE SCHEMA wwi;

Datové typy

Microsoft Fabric podporuje nejčastěji používané datové typy T-SQL.

Kolace

Latin1_General_100_BIN2_UTF8 V současné době je výchozí a podporuje se pouze kolace pro tabulky i metadata.

Statistika

Optimalizátor dotazů používá statistiky na úrovni sloupců při vytváření plánu pro provádění dotazu. Pokud chcete zvýšit výkon dotazů, je důležité mít statistiky o jednotlivých sloupcích, zejména sloupcích používaných ve spojeních dotazů. Warehouse podporuje automatické vytváření statistik.

Statistické aktualizace se neprovádí automaticky. Aktualizujte statistiky po přidání nebo změně významného počtu řádků. Například po načtení aktualizujte statistiky. Další informace najdete v článku Statistika.

Primární klíč, cizí klíč a jedinečný klíč

Pro sklad, PRIMÁRNÍ KLÍČ a JEDINEČNÉ omezení jsou podporovány pouze v případě, že se používají neclustered a NOT VYNUCENé.

CIZÍ KLÍČ je podporován pouze v případech, kdy se používá NOT VYNUCENO.

Zarovnání zdrojových dat s datovým skladem

Tabulky skladu se naplní načtením dat z jiného zdroje dat. Aby bylo dosaženo úspěšného načtení, musí počet a datové typy sloupců ve zdrojových datech odpovídat definici tabulky v datovém skladu.

Pokud data pocházejí z více úložišť dat, můžete je přenést do datového skladu a uložit je do integrační tabulky. Jakmile jsou data v tabulce integrace, můžete k implementaci transformačních operací použít výkon datového skladu. Jakmile jsou data připravená, můžete je vložit do produkčních tabulek.

Omezení

Warehouse podporuje mnoho funkcí tabulek nabízených jinými databázemi, ale ne všechny.

Následující seznam obsahuje některé z funkcí tabulky, které nejsou aktuálně podporované.

  • Maximálně 1024 sloupců na tabulku
  • Počítané sloupce
  • Indexovaná zobrazení
  • Dělené tabulky
  • Sequence
  • Řídké sloupce
  • Náhradní klíče u číselných sekvencí se sloupci Identity
  • Synonyma
  • Dočasné tabulky
  • Spouštěče
  • Jedinečné indexy
  • Uživateli definované typy