Freigeben über


Laden von Beispieldaten in Data Warehouse

In diesem Tutorial erstellen Sie eine Datenpipeline, um ein Beispieldataset in das Data Warehouse zu verschieben. Dieser Schnellstart zeigt Ihnen eine kurze Demo zur Verwendung der Copy-Aktivität der Pipeline und zum Laden von Daten in ein Data Warehouse.

Voraussetzungen

Um zu beginnen, müssen die folgenden Voraussetzungen erfüllt sein:

  • Ein Microsoft Fabric-Mandantenkonto mit einem aktiven Abonnement. Sie können kostenlos ein Konto erstellen.
  • Stellen Sie sicher, dass Sie über einen für Microsoft Fabric aktivierten Arbeitsbereich verfügen: Erstellen eines Arbeitsbereichs.
  • Stellen Sie sicher, dass Sie bereits ein Data Warehouse erstellt haben. Informationen zum Erstellen finden Sie unter Erstellen eines Data Warehouse.

Erstellen einer Datenpipeline

  1. Navigieren Sie zu Power BI.

  2. Wählen Sie unten links auf dem Bildschirm das Power BI-Symbol und dann Data Factory aus, um die Homepage von Data Factory zu öffnen.

  3. Navigieren Sie zu Ihrem Microsoft Fabric-Arbeitsbereich. Wenn Sie im vorherigen Abschnitt „Voraussetzungen“ einen neuen Arbeitsbereich erstellt haben, verwenden Sie diesen Arbeitsbereich.

    Screenshot: Fenster „Arbeitsbereiche“, in dem Sie zu Ihrem Arbeitsbereich navigieren.

  4. Wählen Sie Datenpipeline aus, und geben Sie dann einen Pipelinenamen ein, um eine neue Pipeline zu erstellen.

    Screenshot: Schaltfläche „Neue Datenpipeline“ im neu erstellten Arbeitsbereich.

    Screenshot: Der Name der neu erstellten Pipeline.

Kopieren von Daten mithilfe der Pipeline

In dieser Sitzung beginnen Sie mit dem Erstellen Ihrer Pipeline, indem Sie die folgenden Schritte zum Kopieren aus einem von der Pipeline bereitgestellten Beispieldataset in ein Data Warehouse ausführen.

Schritt 1: Beginnen mit dem Kopier-Assistenten

  1. Nachdem Sie Daten kopieren im Zeichenbereich ausgewählt haben, wird das Tool Kopier-Assistent geöffnet, um die ersten Schritte auszuführen.

    Screenshot der Schaltfläche „Daten kopieren“ einer neuen Pipeline.

Schritt 2: Konfigurieren Ihrer Quelle

  1. Wählen Sie in den Beispieldatenoptionen für Ihre Datenquelle die COVID-19 Data Lake aus, und wählen Sie dann Weiter aus.

    Screenshot der Beispieldatenauswahl „COVID-19 Data Lake“ im Assistenten zum Kopieren von Daten.

  2. Im Abschnitt Verbindung mit Datenquelle herstellen des Assistenten Daten kopieren wird eine Vorschau der Beispieldaten Bing COVID-19 angezeigt. Wählen Sie Weiter aus, um zum Datenziel zu gelangen.

    Screenshot einer Vorschau der Beispieldaten „Bing COVID-19“.

Schritt 3: Konfigurieren Ihres Ziels

  1. Wählen Sie die Registerkarte Arbeitsbereich und dann Data Warehouse aus. Wählen Sie Weiteraus.

    Screenshot der Auswahl des Data Warehouse-Ziels.

  2. Wählen Sie in der Dropdownliste Ihr Data Warehouse und dann Weiter aus.

    Screenshot des Auswählens des Data Warehouse.

  3. Konfigurieren Sie Ihre Quelldaten, und ordnen Sie sie der Data Warehouse -Zieltabelle zu, indem Sie Name der Zieltabelle eingeben und dann noch einmal Weiter auswählen.

    Screenshot des am Data Warehouse-Ziel zu erstellenden Tabellennamens.

  4. Konfigurieren Sie andere Einstellungen auf der Seite Einstellungen. Wählen Sie in diesem Tutorial direkt Weiter aus, da Sie keinen der Befehle „Staging“ und „Copy“ verwenden müssen.

    Screenshot der Zieleinstellungen.

Schritt 4: Überprüfen und Erstellen Ihrer Copy-Aktivität

  1. Überprüfen Sie die Einstellungen Ihrer Copy-Aktivität in den vorherigen Schritten, und wählen Sie OK aus, um den Vorgang abzuschließen. Sie können auch die vorherigen Schritte im Tool wiederholen, um Ihre Einstellungen bei Bedarf zu bearbeiten.

    Screenshot: Seite „Überprüfen und erstellen“ des Assistenten zum Kopieren von Daten mit Hervorhebung von Quelle und Ziel.

  2. Die Copy-Aktivität wird der neuen Datenpipelinecanvas hinzugefügt. Alle Einstellungen (einschließlich erweiterter Einstellungen für die Aktivität) sind auf den Registerkarten unterhalb der Pipelinecanvas verfügbar, wenn die erstellte Aktivität Daten kopieren ausgewählt ist.

    Screenshot der abgeschlossenen Copy-Aktivität in der Pipeline-Canvas.

Ausführen und Planen Ihrer Datenpipeline

  1. Wechseln Sie zur Registerkarte Home, und wählen Sie Ausführen aus. Ein Bestätigungsdialogfeld wird angezeigt. Wählen Sie dann Speichern und ausführen aus, um die Aktivität zu starten.

    Screenshot: Schaltfläche „Ausführen“ auf der Registerkarte „Home“. Die Eingabeaufforderung „Speichern und ausführen“ wird angezeigt.

  2. Sie können den ausgeführten Prozess überwachen und die Ergebnisse auf der Registerkarte Ausgabe unterhalb der Pipelinecanvas überprüfen. Wählen Sie die Schaltfläche „Ausführungsdetails“ (mit hervorgehobenem Brillensymbol) aus, um die Ausführungsdetails anzuzeigen.

    Screenshot: Registerkarte „Ausgabe“ der aktuellen Pipelineausführung mit hervorgehobener Schaltfläche „Details“ im Ausführungsstatus.

  3. Die Ausführungsdetails zeigen, wie viele Daten gelesen und geschrieben wurden, sowie verschiedene andere Details zur Ausführung.

    Screenshot: Fenster mit den Ausführungsdetails.

  4. Sie können die Ausführung der Pipeline auch nach Bedarf mit einer bestimmten Häufigkeit planen. Im Folgenden finden Sie ein Beispiel, in dem die Ausführung der Pipeline alle 15 Minuten geplant wird. Sie können auch die Start- und Endzeit für Ihren Zeitplan angeben. Wenn Sie keine Startzeit angeben, ist die Startzeit der Zeitpunkt, ab dem Ihr Zeitplan gilt. Wenn Sie keine Endzeit angeben, wird die Pipelineausführung alle 15 Minuten wiederholt.

    Screenshot: Dialogfeld „Zeitplan“ für die Pipeline mit einem 15-minütigen wiederkehrenden Zeitplan.

In diesem Beispiel wird gezeigt, wie Sie Beispieldaten mithilfe von Data Factory in Microsoft Fabric in ein Data Warehouse laden. Sie haben Folgendes gelernt:

  • Erstellen einer Datenpipeline.
  • Kopieren von Daten mithilfe Ihrer Pipeline.
  • Ausführen und Planen Ihrer Datenpipeline.

Erfahren Sie im nächsten Schritt mehr über die Überwachung Ihrer Pipelineausführungen.