Tabellen im Data Warehousing in Microsoft Fabric

Gilt für: Warehouse in Microsoft Fabric

In diesem Artikel werden die wichtigsten Konzepte zum Entwerfen von Tabellen in Microsoft Fabric beschrieben.

In Tabellen werden Daten logisch in einem Zeilen- und Spaltenformat organisiert. Jede Zeile stellt einen eindeutigen Datensatz und jede Spalte ein Feld im Datensatz dar.

  • In Warehouse sind Tabellen Datenbankobjekte, die alle Transaktionsdaten enthalten.

Wichtig

Microsoft Fabric befindet sich derzeit in der Vorschauversion. Diese Informationen beziehen sich auf eine Vorabversion des Produkts, an der vor der Veröffentlichung noch wesentliche Änderungen vorgenommen werden können. Microsoft übernimmt keine Garantie, weder ausdrücklich noch stillschweigend, für die hier bereitgestellten Informationen.

Bestimmen der Tabellenkategorie

In einem Sternschema werden Daten in Fakten-und Dimensionstabellen organisiert. Einige Tabellen werden für die Integration oder das Staging von Daten verwendet, bevor sie in eine Fakten- oder Dimensionstabelle verschoben werden. Wenn Sie eine Tabelle entwerfen, entscheiden Sie, ob die Tabellendaten in einer Faktentabelle, eine Dimensionstabelle oder eine Integrationstabelle gehören. Diese Entscheidung informiert die entsprechende Tabellenstruktur.

  • Faktentabellen enthalten quantitative Daten, die häufig in einem transaktionalen System generiert und dann in das Data Warehouse geladen werden. Beispielsweise generiert ein Einzelhandelsunternehmen täglich Verkaufstransaktionen und lädt dann die Daten zur Analyse in eine Faktentabelle in ein Data Warehouse.

  • Dimensionstabellen enthalten Attributdaten, die sich ändern können, es in der Regel jedoch nur selten tun. Beispielsweise werden der Name und die Adresse eines Kunden in einer Dimensionstabelle gespeichert und nur aktualisiert, wenn sich das Profil des Kunden ändert. Damit eine Faktentabelle nicht zu groß wird, kann darauf verzichtet werden, den Namen und die Adresse des Kunden in jede Zeile der Faktentabelle aufzunehmen. Stattdessen kann eine Kunden-ID von der Faktentabelle und der Dimensionstabelle gemeinsam genutzt werden. Die beiden Tabellen können mithilfe einer Abfrage verknüpft werden, um das Profil eines Kunden den Transaktionen zuzuordnen.

  • Integrationstabellen werden für das Integrieren oder Staging von Daten verwendet. Sie können z. B. Daten in eine Stagingtabelle laden, Transformationen für die Daten in der Stagingumgebung durchführen und die Daten dann in eine Produktionstabelle einfügen.

Eine Tabelle speichert Daten in der OneLake-Übersicht als Teil des Warehouse. Die Tabelle und die Daten werden unabhängig davon beibehalten, ob eine Sitzung geöffnet ist.

Tabellen im Warehouse

Um die organization der Tabellen anzuzeigen, können Sie , dimoder int als Präfixe für die Tabellennamen verwendenfact. Die folgende Tabelle zeigt einige der Schema- und Tabellennamen für WideWorldImportersDW-Beispiel-Data Warehouse.

WideWorldImportersDW-Quelltabellenname Tabellentyp Data Warehouse Tabellenname
City Dimension wwi.DimCity
Order Fakt wwi.FactOrder
  • Bei Tabellennamen wird die Groß-/Kleinschreibung beachtet.
  • Tabellennamen dürfen nicht oder \enthalten/.

Erstellen einer Tabelle

Für Warehouse können Sie eine Tabelle als neue leere Tabelle erstellen. Alternativ können Sie eine Tabelle erstellen und mit den Ergebnissen einer SELECT-Anweisung füllen. Es folgen die T-SQL-Befehle zum Erstellen einer Tabelle.

T-SQL-Anweisung BESCHREIBUNG
CREATE TABLE Erstellt eine leere Tabelle durch die Definition der Tabellenspalten und Optionen.
CREATE TABLE AS SELECT Füllt eine neue Tabelle mit den Ergebnissen einer SELECT-Anweisung. Die Spalten und Datentypen der Tabelle basieren auf den Ergebnissen der SELECT-Anweisung. Mit dieser Anweisung können Daten zum Importieren aus einer externen Tabelle ausgewählt werden.

In diesem Beispiel wird eine Tabelle mit zwei Spalten erstellt:

CREATE TABLE MyTable (col1 int, col2 int );  

Schemanamen

Warehouse unterstützt die Erstellung benutzerdefinierter Schemas. Wie in SQL Server sind Schemas eine gute Möglichkeit, Objekte zu gruppieren, die auf ähnliche Weise verwendet werden. Mit dem folgenden Code wird ein benutzerdefiniertes Schema mit dem Namen wwi erstellt.

CREATE SCHEMA wwi;

Datentypen

Microsoft Fabric unterstützt die am häufigsten verwendeten T-SQL-Datentypen.

Sortierung

Latin1_General_100_BIN2_UTF8 Derzeit ist die Standardsortierung und wird nur für Tabellen und Metadaten unterstützt.

Statistik

Der Abfrageoptimierer verwendet beim Erstellen des Plans für die Ausführung einer Abfrage Statistiken auf Spaltenebene. Um die Abfrageleistung zu verbessern, ist es wichtig, über Statistiken für einzelne Spalten zu verfügen, insbesondere für in Abfrageverknüpfungen verwendete Spalten. Warehouse unterstützt die automatische Erstellung von Statistiken.

Die Aktualisierung der Statistiken erfolgt nicht automatisch. Führen Sie die Statistikaktualisierung durch, wenn eine erhebliche Anzahl von Zeilen hinzugefügt oder geändert wurde. Aktualisieren Sie Statistiken z. B. nach einem Ladevorgang. Weitere Informationen finden Sie unter Verwalten von Statistiken für Tabellen in SQL Data Warehouse.

Primärschlüssel, Fremdschlüssel und eindeutiger Schlüssel

Für Warehouse werden PRIMARY KEY und UNIQUE nur unterstützt, wenn NONCLUSTERED und NOT ENFORCED verwendet werden.

FOREIGN KEY wird nur unterstützt, wenn NOT ENFORCED verwendet wird.

Ausrichten von Quelldaten am Data Warehouse

Warehouse-Tabellen werden aufgefüllt, indem Daten aus einer anderen Datenquelle geladen werden. Um einen Ladevorgang erfolgreich ausführen zu können, müssen die Anzahl und die Datentypen der Spalten in den Quelldaten an der Tabellendefinition im Data Warehouse ausgerichtet werden.

Wenn Daten aus mehreren Datenspeichern stammen, können Sie die Daten in das Data Warehouse übertragen und in einer Integrationstabelle speichern. Sobald sich Daten in der Integrationstabelle befinden, können Sie die Leistungsfähigkeit von Data Warehouse nutzen, um Transformationsvorgänge zu implementieren. Sobald die Daten vorbereitet sind, können Sie sie in Produktionstabellen einfügen.

Einschränkungen

Warehouse unterstützt viele, aber nicht alle Tabellenfeatures, die von anderen Datenbanken angeboten werden.

In der folgenden Liste werden einige der Tabellenfeatures aufgeführt, die derzeit nicht unterstützt werden. Während der Vorschau kann sich diese Liste ändern.

  • Berechnete Spalten
  • Indizierte Sichten
  • Sequenz
  • Spalten mit geringer Dichte
  • Ersatzschlüssel für Zahlensequenzen mit Identitätsspalten
  • Synonyme
  • Auslöser
  • Eindeutige Indizes
  • Benutzerdefinierte Typen
  • Temporäre Tabellen

Nächste Schritte