Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Platí pro:✅ Sklad v Microsoft Fabric
Tento článek podrobně popisuje klíčové koncepty návrhu tabulek v Microsoft Fabric.
V tabulkách jsou data logicky uspořádaná ve formátu řádků a sloupců. Každý řádek představuje jedinečný záznam a každý sloupec představuje pole v záznamu.
Určení kategorie tabulky
Hvězdicové schéma uspořádá data do tabulek faktů a tabulek dimenzí. Některé tabulky se používají pro integraci nebo přípravná data před přechodem na tabulku faktů nebo dimenzí. Při návrhu tabulky se rozhodněte, jestli data tabulky patří do faktu, dimenze nebo integrační tabulky. Toto rozhodnutí určuje příslušnou strukturu tabulky.
Tabulky faktů obsahují kvantitativní data, která se běžně generují v transakčním systému, a pak se načtou do datového skladu. Například maloobchodní firma generuje prodejní transakce každý den a pak načte data do tabulky faktů datového skladu pro účely analýzy.
Tabulky dimenzí obsahují data atributů, která se můžou změnit, ale obvykle se mění jen zřídka. Například jméno a adresa zákazníka se ukládají v tabulce dimenzí a aktualizují se jenom v případě, že se profil zákazníka změní. Aby se minimalizovala velikost velké tabulky faktů, nemusí být jméno a adresa zákazníka na každém řádku tabulky faktů. Místo toho může tabulka faktů a tabulka dimenzí sdílet ID zákazníka. Dotaz může spojit dvě tabulky a přidružit profil a transakce zákazníka.
Integrační tabulky poskytují místo pro integraci nebo přípravu dat. Můžete například načíst data do pracovní tabulky, provést transformace dat v přípravné fázi a pak je vložit do produkční tabulky.
Tabulka ukládá data ve OneLake jako součást úložiště. Tabulka a data se zachovají bez ohledu na to, jestli je relace otevřená.
Tabulky ve skladu
Pokud chcete zobrazit uspořádání tabulek, můžete použít factdim, nebo int jako předpony názvů tabulek. Následující tabulka uvádí některé názvy schémat a tabulek pro ukázkový datový sklad WideWorldImportersDW .
| Název zdrojové tabulky WideWorldImportersDW | Typ tabulky | Název tabulky Data Warehouse |
|---|---|---|
| Město | Dimenze | wwi.DimCity |
| Objednávka | Fakt | wwi.FactOrder |
- Názvy tabulek nemůžou obsahovat
/ani\končit tečkou..
Vytvoření tabulky
Pro Sklad můžete vytvořit tabulku jako novou prázdnou tabulku. Můžete také vytvořit a naplnit tabulku výsledky příkazu select. Následují příkazy T-SQL pro vytvoření tabulky.
| Příkaz T-SQL | Popis |
|---|---|
| Vytvořit tabulku (CREATE TABLE) | Vytvoří prázdnou tabulku definováním všech sloupců a možností tabulky. |
| VYTVOŘIT TABULKU JAKO VÝBĚR | Naplní novou tabulku výsledky příkazu select. Sloupce tabulky a datové typy jsou založené na výsledcích příkazu select. Pro importování dat může tento příkaz vybírat z externí tabulky. |
Tento příklad vytvoří tabulku se dvěma sloupci:
CREATE TABLE MyTable (col1 int, col2 int );
Názvy schématu
Warehouse podporuje vytváření vlastních schémat. Podobně jako v SQL Server jsou schémata dobrým způsobem, jak seskupit objekty, které se používají podobným způsobem. Následující kód vytvoří uživatelem definované schéma s názvem wwi.
- V názvech schémat se rozlišují malá a velká písmena.
- Názvy schémat nemohou obsahovat
/ani\končit písmenem..
CREATE SCHEMA wwi;
Datové typy
Microsoft Fabric podporuje nejčastěji používané datové typy T-SQL.
- Další informace o datových typech najdete v tématu Datové typy v Fabric Data Warehouse.
- Při vytváření tabulky ve službě Warehouse zkontrolujte odkaz na typy dat v příkazu CREATE TABLE (Transact-SQL).
- Průvodce vytvořením tabulky ve skladu najdete v tématu Vytvoření tabulek.
Řazení
Sklady Fabric se konfigurují na základě nastavení kolace pracovního prostoru, což je ve výchozím nastavení kolace s rozlišením velikosti písmen (CS) Latin1_General_100_BIN2_UTF8. Při vytváření nového skladu se použije kolace pracovního prostoru. Další informace najdete v tématu kolace datového skladu.
Mezi podporované kolace skladu patří:
-
Latin1_General_100_BIN2_UTF8(výchozí) Latin1_General_100_CI_AS_KS_WS_SC_UTF8
Pomocí rozhraní REST API můžete vytvořit sklad s nevýchozí kolací. Další informace najdete v tématu Postupy: Vytvoření skladu s porovnáváním nerozlišujícím velikost písmen (CI).
Po nastavení kolace během vytváření databáze zdědí všechny následující objekty (tabulky, sloupce atd.) tuto výchozí kolaci. Po vytvoření skladu nelze nastavení kolace změnit.
Statistika
Optimalizátor dotazů používá statistiky na úrovni sloupců při vytváření plánu pro provádění dotazu. Pokud chcete zvýšit výkon dotazů, je důležité mít statistiky o jednotlivých sloupcích, zejména sloupcích používaných ve spojeních dotazů. Warehouse podporuje automatické vytváření statistik.
Statistické aktualizace se neprovádí automaticky. Aktualizujte statistiky po přidání nebo změně významného počtu řádků. Aktualizujte statistiky například po načtení. Další informace najdete v tématu Statistika v Fabric Data Warehouse.
Primární klíč, cizí klíč a jedinečný klíč
Pro omezení skladu PRIMARY KEY a UNIQUE jsou podporována pouze tehdy, když jsou obě možnosti NONCLUSTERED a NOT ENFORCED použity.
FOREIGN KEY se podporuje pouze v případech, kdy NOT ENFORCED se používá.
- V případě syntaxe zaškrtněte příkaz ALTER TABLE.
- Další informace najdete v tématu Primární klíče, cizí klíče a jedinečné klíče.
#dočasné tabulky
Dočasné tabulky s oborem relace (#temp) je možné vytvořit v Fabric Data Warehouse.
Tyto tabulky v rámci relace, ve které jsou vytvořeny, existují pouze a trvají po dobu trvání této relace. Nejsou viditelné jiným uživatelům nebo relacím a po ukončení relace nebo vyřazení tabulky #temp se automaticky vyřadí ze systému. Tyto tabulky jsou přístupné všem uživatelům bez nutnosti konkrétního oprávnění na úrovni položky.
Na základě konkrétních případů použití je možné vytvořit dva typy #temp tabulek: nedistribuované a distribuované.
Výchozí typ je nedistribuovaná tabulka #temp (mDF). Syntaxe pro vytváření a používání nedistribuovaných tabulek #temp v Fabric Data Warehouse se podobá uživatelským tabulkám, ale název dočasné tabulky musíte předponovat názvem dočasné tabulky
#.CREATE TABLE #table_name ( Col1 data_type1, Col2 data_type2 );Dočasné distribuované tabulky (založené na Parquet) lze vytvořit pomocí klíčového slova
DISTRIBUTION=ROUND_ROBIN.CREATE TABLE #table_name ( Col1 data_type1, Col2 data_type2 ) WITH (DISTRIBUTION=ROUND_ROBIN);
V předchozím skriptu jsou data_type1 a data_type2 zástupné symboly pro podporované typy Data v Fabric Data Warehouse.
Distribuované #temp tabulky se doporučují, protože odpovídají běžným uživatelským tabulkám; mají neomezené úložiště, podporu datových typů a operace T-SQL.
Další poznámky k dočasným tabulkám v Fabric Data Warehouse:
- Syntaxe pro manipulaci s daty a definice je shodná s tabulkami uživatelů v Fabric Data Warehouse s předponou
#přidanou do názvu tabulky. - Dočasné tabulky nejsou ovlivněny nápovědami dotazů na cestování času a vždy vracejí nejnovější data v tabulce.
- Distribuované dočasné tabulky můžete měnit pomocí
ALTER TABLE, ale ne s dočasnými tabulkami založenými na MDF.
Zarovnání zdrojových dat s datovým skladem
Tabulky skladu se naplní načtením dat z jiného zdroje dat. Aby bylo dosaženo úspěšného načtení, musí počet a datové typy sloupců ve zdrojových datech odpovídat definici tabulky ve skladu.
Pokud data pocházejí z více úložišť dat, můžete je přenést do skladu a uložit je do integrační tabulky. Jakmile jsou data v tabulce integrace, můžete k implementaci transformačních operací použít výkon skladu. Jakmile jsou data připravená, můžete je vložit do produkčních tabulek.
Omezení
Warehouse podporuje mnoho funkcí tabulek nabízených jinými databázemi, ale ne všechny.
- Globální dočasné tabulky nejsou v současné době podporovány.
Následující seznam obsahuje některé z funkcí tabulky, které nejsou aktuálně podporované.
Maximálně 1 024 sloupců na tabulku
Počítané sloupce
Indexovaná zobrazení
Dělené tabulky
Sekvence
Řídké sloupce
Synonyma
Aktivační události
Jedinečné indexy
Uživateli definované typy
Externí tabulky
Metadata objektu skladu se ukládají do mezipaměti Fabric Data Warehouse, aby poskytovala rychlý přístup k objektům a jejich definicím. U velmi velkých skladů s více než 750 000 objekty (například tabulky, zobrazení, uložené procedury a funkce) už systém metadata neukládá do mezipaměti. Místo toho operace schématu dotazuje úložiště metadat přímo. Tím zajistíte stabilitu systému a zabráníte hladovění mezipaměti v extrémně velkých databázích. Operace aktualizace schématu ale můžou trvat déle než menší sklady, kde je povolené ukládání metadat do mezipaměti.
Důležité
Při použití správy zdrojového kódu se skladem existují omezení při přidávání omezení tabulky nebo sloupců.
Související obsah
- Co je Fabric Data Warehouse?
- Co je inženýrství dat v Microsoft Fabric?
- Vytvoření skladu v Microsoft Fabric
- V Microsoft Fabric dotazujte koncový bod analýzy SQL nebo datový sklad
- OneLake, OneDrive pro data
- Vytváření tabulek ve skladu v Microsoft Fabric
- Transakce ve skladových tabulkách v Microsoft Fabric