Táblák az adattárházakban a Microsoft Fabricben

A következőre vonatkozik: Warehouse a Microsoft Fabricben

Ez a cikk a Microsoft Fabricben lévő táblák tervezésének legfontosabb fogalmait ismerteti.

A táblákban az adatok logikailag sor- és oszlopformátumban lesznek rendszerezve. Minden sor egyedi rekordot jelöl, az egyes oszlopok pedig a rekord egy mezőjét.

  • A Warehouse-ban a táblák olyan adatbázis-objektumok, amelyek az összes tranzakciós adatot tartalmazzák.

Táblakategória meghatározása

A csillagséma tény- és dimenziótáblákba rendezi az adatokat. Egyes táblákat az integrációhoz vagy az adatok átmeneti tárolásához használunk, mielőtt egy tény- vagy dimenziótáblára lépnénk. Táblázat tervezésekor döntse el, hogy a tábla adatai tény-, dimenzió- vagy integrációs táblába tartoznak-e. Ez a döntés tájékoztatja a megfelelő táblázatstruktúrát.

  • A ténytáblák olyan mennyiségi adatokat tartalmaznak, amelyeket általában egy tranzakciós rendszerben hoznak létre, majd betöltik az adattárházba. Egy kiskereskedelmi vállalat például naponta hoz létre értékesítési tranzakciókat, majd betölti az adatokat egy adattárház ténytáblájába elemzés céljából.

  • A dimenziótáblák olyan attribútumadatokat tartalmaznak, amelyek változhatnak, de általában ritkán változnak. Az ügyfél neve és címe például egy dimenziótáblában van tárolva, és csak akkor frissül, ha az ügyfél profilja megváltozik. A nagy ténytáblák méretének minimalizálásához az ügyfél nevének és címének nem kell egy ténytábla minden sorában lennie. Ehelyett a ténytábla és a dimenziótábla megoszthat egy ügyfél-azonosítót. A lekérdezések összekapcsolhatják a két táblát az ügyfél profiljának és tranzakcióinak társításához.

  • Az integrációs táblák helyet biztosítanak az adatok integrálásához vagy átmeneti tárolásához. Betöltheti például az adatokat egy átmeneti táblába, átalakításokat hajthat végre az előkészítésben lévő adatokon, majd beszúrhatja az adatokat egy éles táblába.

A tábla a OneLake-ben tárolja az adatokat a Warehouse részeként. A tábla és az adatok megmaradnak, függetlenül attól, hogy egy munkamenet meg van-e nyitva.

Táblák a raktárban

A táblák rendszerezésének megjelenítéséhez használhatja factdima táblanevek előtagját vagy int előtagját. Az alábbi táblázat a WideWorldImportersDW mintaadatraktár néhány sémáját és táblanevét mutatja be.

WideWorldImportersDW forrástábla neve Táblázat típusa Adattárház tábla neve
City Dimenzió wwi.DimCity
Sorrend Fact wwi.FactOrder
  • A táblanevek megkülönböztetik a kis- és nagybetűket.
  • A táblanevek nem tartalmazhatnak / vagy \ végződhetnek ..

Create a table

A Warehouse esetében létrehozhat egy táblát új üres táblaként. Emellett létrehozhat és feltölthet egy táblázatot egy kijelölési utasítás eredményeivel. A táblázat létrehozásához a következő T-SQL-parancsok tartoznak.

T-SQL-utasítás Leírás
CREATE TABLE Üres táblát hoz létre az összes táblaoszlop és beállítás megadásával.
CREATE TABLE AS SELECT Feltölt egy új táblát egy kijelölési utasítás eredményével. A táblaoszlopok és adattípusok a select utasítás eredményein alapulnak. Az adatok importálásához ez az utasítás kiválasztható egy külső táblából.

Ez a példa két oszlopból áll:

CREATE TABLE MyTable (col1 int, col2 int );  

Sémanevek

A Warehouse támogatja az egyéni sémák létrehozását. Az SQL Serverhez hasonlóan a sémák is jól csoportosítják a hasonló módon használt objektumokat. Az alábbi kód létrehoz egy felhasználó által definiált sémát.wwi

  • A sémanevek megkülönböztetik a kis- és nagybetűket.
  • A sémanevek nem tartalmazhatnak / vagy \ végződhetnek ..
CREATE SCHEMA wwi;

Adattípusok

A Microsoft Fabric támogatja a leggyakrabban használt T-SQL-adattípusokat.

Rendezés

Latin1_General_100_BIN2_UTF8 Jelenleg ez a táblák és metaadatok alapértelmezett és csak támogatott rendezése.

Statistics

A lekérdezésoptimalizáló oszlopszintű statisztikákat használ, amikor létrehozza a lekérdezés végrehajtásához szükséges tervet. A lekérdezési teljesítmény javítása érdekében fontos, hogy az egyes oszlopokra, különösen a lekérdezési illesztésekben használt oszlopokra vonatkozó statisztikák rendelkezzenek. A Warehouse támogatja a statisztikák automatikus létrehozását.

A statisztikai frissítés nem történik meg automatikusan. Jelentős számú sor hozzáadása vagy módosítása után frissítse a statisztikákat. Például a terhelés után frissítse a statisztikákat. További információ: Statisztika.

Elsődleges kulcs, idegen kulcs és egyedi kulcs

A Raktár esetében az ELSŐDLEGES KULCS és az EGYEDI kényszer csak akkor támogatott, ha a NEMCLUSTERED és a NOT ENFORCED is használatos.

A KÜLFÖLDI KULCS csak akkor támogatott, ha NINCS KÉNYSZERÍTVE.

Forrásadatok igazítása az adattárházhoz

A raktártáblák feltöltése egy másik adatforrásból származó adatok betöltésével lehetséges. A sikeres terhelés eléréséhez a forrásadatok oszlopainak számának és adattípusainak összhangban kell lenniük az adattárházban lévő tábladefinícióval.

Ha az adatok több adattárból származnak, akkor az adatokat az adattárházba is átküldheti, és egy integrációs táblában tárolhatja. Miután az adatok az integrációs táblában szerepelnek, az adattárház erejét használhatja az átalakítási műveletek implementálásához. Az adatok előkészítése után beszúrhatja őket az éles táblákba.

Korlátozások

A Warehouse számos, de nem az összes táblafunkciót támogat, amelyeket más adatbázisok kínálnak.

Az alábbi lista néhány olyan táblafunkciót mutat be, amelyek jelenleg nem támogatottak.

  • Táblázatonként legfeljebb 1024 oszlop
  • Számított oszlopok
  • Indexelt nézetek
  • Particionált táblák
  • Szekvencia
  • Ritka oszlopok
  • Helyettesítő kulcsok identitásoszlopokkal rendelkező számütemezéseken
  • Szinonimák
  • ideiglenes táblákkal
  • Triggers
  • Egyedi indexek
  • Felhasználó által definiált típusok