Einführung in das Data Warehouse-Tutorial

Gilt für: SQL-Endpunkt und -Warehouse in Microsoft Fabric

Microsoft Fabric bietet eine zentrale Anlaufstelle für alle analytischen Anforderungen für jedes Unternehmen. Es deckt das gesamte Spektrum an Dienstleistungen ab, einschließlich Datenverschiebung, Data Lake, Datentechnik, Datenintegration und Data Science, Echtzeitanalysen und Business Intelligence. Mit Microsoft Fabric müssen keine verschiedenen Dienste von mehreren Anbietern zusammengefügt werden. Stattdessen genießt der Kunde ein umfassendes, umfassendes End-to-End-Produkt, das leicht zu verstehen, zu integrieren, zu erstellen und zu betreiben ist. Kein anderes Produkt auf dem Markt bietet die Breite, Tiefe und Integrationsebene, die Microsoft Fabric bietet. Darüber hinaus ist Microsoft Purview standardmäßig in jedem Mandanten enthalten, um Compliance- und Governanceanforderungen zu erfüllen.

Wichtig

Microsoft Fabric befindet sich derzeit in der VORSCHAU. Diese Informationen beziehen sich auf eine Vorabversion des Produkts, an der vor der Veröffentlichung noch wesentliche Änderungen vorgenommen werden können. Microsoft übernimmt keine Garantie, weder ausdrücklich noch stillschweigend, für die hier bereitgestellten Informationen.

Zweck dieses Tutorials

Viele Konzepte in Microsoft Fabric sind Daten- und Analyseexperten zwar bekannt, es kann jedoch schwierig sein, diese Konzepte in einer neuen Umgebung anzuwenden. Dieses Tutorial wurde entwickelt, um schrittweise ein End-to-End-Szenario von der Datenerfassung bis zur Datennutzung zu durchlaufen, um ein grundlegendes Verständnis der Microsoft Fabric-Benutzeroberfläche, der verschiedenen Erfahrungen und ihrer Integrationspunkte sowie der professionellen und citizen Entwicklererfahrungen von Microsoft Fabric zu schaffen.

Die Tutorials sind nicht als Referenzarchitektur, als vollständige Liste von Features und Funktionen oder als Empfehlung bestimmter bewährter Methoden gedacht.

End-to-End-Szenario für Data Warehouse

Führen Sie als Voraussetzungen für dieses Tutorial die folgenden Schritte aus:

  1. Melden Sie sich bei Ihrem Power BI-Onlinekonto an, oder wenn Sie noch kein Konto besitzen, registrieren Sie sich für eine kostenlose Testversion.
  2. Aktivieren Sie Microsoft Fabric in Ihrem Mandanten.

In diesem Tutorial übernehmen Sie die Rolle eines Warehouse-Entwicklers im fiktiven Unternehmen Wide World Importers und führen die folgenden Schritte im Microsoft Fabric-Portal aus, um eine End-to-End-Data Warehouse-Lösung zu erstellen und zu implementieren:

  1. Erstellen Sie einen Microsoft Fabric-Arbeitsbereich.
  2. Erstellen Sie ein Warehouse.
  3. Erfassen Von Daten aus der Quelle in das Data Warehouse-Dimensionsmodell mit einer Datenpipeline.
  4. Erstellen Sie Tabellen in Ihrem Warehouse.
  5. Laden Sie Daten mit T-SQL mit dem SQL-Abfrage-Editor.
  6. Transformieren Sie die Daten , um aggregierte Datasets mithilfe von T-SQL zu erstellen.
  7. Verwenden Sie den visuellen Abfrage-Editor , um das Data Warehouse abzufragen.
  8. Analysieren von Daten mit einem Notebook.
  9. Erstellen und Ausführen von warehouseübergreifenden Abfragen mit dem SQL-Abfrage-Editor.
  10. Erstellen Sie Power BI-Berichte im DirectLake-Modus, um die daten vor Ort zu analysieren.
  11. Erstellen Sie einen Bericht aus dem Data Hub.
  12. Bereinigen Sie Ressourcen , indem Sie den Arbeitsbereich und andere Elemente löschen.

End-to-End-Architektur für Data Warehouse

Diagramm, das die End-to-End-Architektur des Data Warehouse zeigt.

Datenquellen : Microsoft Fabric erleichtert das Herstellen einer Verbindung mit Azure Data Services, anderen Cloudplattformen und lokalen Datenquellen zum Erfassen von Daten.

Erfassung: Mit mehr als 200 nativen Connectors als Teil der Microsoft Fabric-Pipeline und der Datentransformation per Drag and Drop mit Dataflow können Sie schnell Erkenntnisse für Ihre organization erstellen. Shortcut ist ein neues Feature in Microsoft Fabric, das eine Möglichkeit bietet, eine Verbindung mit vorhandenen Daten herzustellen, ohne sie kopieren oder verschieben zu müssen. Weitere Informationen zum Tastenkombinationsfeature finden Sie weiter unten in diesem Tutorial.

Transformieren und Speichern : Microsoft Fabric standardisiert das Delta Lake-Format. Dies bedeutet, dass alle Engines von Microsoft Fabric dasselbe in OneLake gespeicherte Dataset lesen und bearbeiten können . Dies ist nicht erforderlich. Mit diesem Speicher können Sie ein Data Warehouse oder ein Data Mesh basierend auf den Anforderungen Ihrer Organisation erstellen. Für die Transformation können Sie entweder low-code oder no-code experience with pipelines/dataflows auswählen oder T-SQL für eine Code first-Erfahrung verwenden.

Nutzen : Daten aus dem Data Warehouse können von Power BI, dem branchenführenden Business Intelligence-Tool, für Berichte und Visualisierungen genutzt werden. Jedes Data Warehouse verfügt über einen integrierten TDS/SQL-Endpunkt, um bei Bedarf problemlos eine Verbindung mit anderen Berichtstools herzustellen und Daten von diesen abzufragen. Wenn ein Data Warehouse erstellt wird, wird gleichzeitig ein sekundäres Element mit demselben Namen generiert, das als Standarddataset bezeichnet wird. Sie können das Standarddataset verwenden, um mit der Visualisierung von Daten mit nur wenigen Schritten zu beginnen.

Beispieldaten

Für Beispieldaten verwenden wir die WWI-Beispieldatenbank (Wide World Importers). Für unser End-to-End-Szenario für Data Warehouse haben wir genügend Daten generiert, um einen Einblick in die Skalierungs- und Leistungsfunktionen der Microsoft Fabric-Plattform zu erhalten.

Wide World Importers (WWI) ist ein Großhandelsimporteur und -händler, der von der San Francisco Bay aus tätig ist. Als Großhändler hat WWI hauptsächlich Unternehmen als Kunden, die an Einzelpersonen weiterverkaufen. WWI verkauft an Einzelhandelskunden in den USA. Zu ihnen gehören Fachgeschäfte, Supermärkte, Computergeschäfte, touristische Geschäfte und einige Einzelpersonen. WWI verkauft seine Produkte über Zwischenhändler, die die Produkte im Auftrag von WWI bewerben, auch an andere Großhändler. Weitere Informationen zum Unternehmensprofil und -betrieb finden Sie unter Wide World Importers-Beispieldatenbanken für Microsoft SQL.

In der Regel würden Sie Daten aus Transaktionssystemen (oder Branchenanwendungen) in einen Data Lake- oder Data Warehouse-Stagingbereich übertragen. Für dieses Tutorial verwenden wir jedoch das vom WWI bereitgestellte Dimensionsmodell als erste Datenquelle. Wir verwenden sie als Quelle, um die Daten in einem Data Warehouse zu erfassen und über T-SQL zu transformieren.

Datenmodell

Während das WWI-Dimensionsmodell mehrere Faktentabellen enthält, konzentrieren wir uns in diesem Tutorial nur auf die Tabelle Verkaufs-Fakten und die zugehörigen Dimensionen, wie folgt, um dieses End-to-End-Data Warehouse-Szenario zu veranschaulichen:

Diagramm, das das Datenmodell zeigt, das Sie in diesem Tutorial verwenden, das die Tabelle

Nächste Schritte