Kopieren aus Azure Blob Storage in Lakehouse

In diesem Tutorial erstellen Sie eine Datenpipeline, um eine CSV-Datei aus einem Eingabeordner einer Azure Blob Storage-Quelle in ein Lakehouse-Ziel zu verschieben.

Voraussetzungen

Um zu beginnen, müssen die folgenden Voraussetzungen erfüllt sein:

  • Stellen Sie sicher, dass Sie über einen für Project Microsoft Fabric aktivierten Arbeitsbereich verfügen: Erstellen eines Arbeitsbereichs.

  • Wählen Sie die Schaltfläche Jetzt testen! aus, um die Azure Blob Storage-Datenquelle des Kopiervorgangs vorzubereiten. Erstellen Sie eine neue Ressourcengruppe für diese Azure Blob Storage-Instanz, und wählen Sie Überprüfen und Erstellen>Erstellen aus.

    Try your first data factory demo

    Screenshot of Project details screen.

    Anschließend wird eine Azure Blob Storage-Instanz erstellt und moviesDB2.csv in den Eingabeordner der erstellten Azure Blob Storage-Instanz hochgeladen.

    Screenshot showing where new storage appears in folder.

Erstellen einer Datenpipeline

  1. Wechseln Sie auf der Seite „app.powerbi.com“ zu Data Factory.

    Screenshot of menu in which Data factory option appears.

  2. Erstellen Sie einen neuen Arbeitsbereich für diese Demo.

    Screenshot of Workspace screen.

  3. Wählen Sie Neu und dann Datenpipeline aus.

    Screenshot of the New menu.

Kopieren von Daten mithilfe des Kopier-Assistenten

In dieser Sitzung beginnen Sie mit dem Erstellen einer Datenpipeline, indem Sie die folgenden Schritte ausführen. Mit diesen Schritten wird eine CSV-Datei aus einem Eingabeordner einer Azure Blob Storage-Instanz in ein Lakehouse-Ziel kopiert, indem Sie den Assistenten verwenden.

Schritt 1: Beginnen mit dem Kopier-Assistenten

  1. Wählen Sie Daten kopieren auf dem Canvas aus, um den Kopier-Assistenten für erste Schritte zu öffnen. Alternativ können Sie in der Dropdownliste Daten kopieren auf der Registerkarte Aktivitäten im Menüband die Option Kopier-Assistent verwenden auswählen.

    Screenshot of two options to select copy assistant.

Schritt 2: Konfigurieren der Quelle

  1. Wählen Sie Azure Blob Storage aus, und klicken Sie dann auf Weiter.

    Screenshot showing where to choose Azure Blob Storage as data source.

  2. Stellen Sie eine Verbindung mit Ihrer Datenquelle her, indem Sie Neue Verbindung erstellen auswählen.

    Screenshot showing where to select New connection.

    1. Nachdem Sie Neue Verbindung erstellen ausgewählt haben, müssen Sie nur Kontoname oder URL und die Authentifizierungsart eingeben. Wenn Sie Kontoname oder URL mit Ihrem Azure Blob Storage Kontonamen eingeben, wird die Verbindung automatisch mit Daten aufgefüllt. In dieser Demo wählen wir Kontoschlüssel aus, aber Sie können eine andere Authentifizierungsart gemäß Ihren Einstellungen auswählen. Nachdem Sie Anmelden ausgewählt haben, müssen Sie sich nur bei einem Konto anmelden, das über diese Blobspeicherberechtigung verfügt.

      Screenshot showing the Connect to data source screen of the copy data assistant.

    2. Nachdem die Verbindung erfolgreich hergestellt wurde, müssen Sie nur „Weiter“ auswählen, um eine Verbindung mit der Datenquelle herzustellen.

  3. Wählen Sie die Datei moviesDB2.csv in der „Quellkonfiguration“ aus, um eine Vorschau anzuzeigen, und wählen Sie dann Weiter aus.

    Screenshot showing how to choose data source.

Schritt 3: Konfigurieren des Ziels

  1. Wählen Sie Lakehouse und dann Weiter aus.

    Screenshot showing the Choose data destination dialog with Lakehouse selected.

  2. Erstellen Sie ein neues Lakehouse, und geben Sie den Lakehouse-Namen ein. Wählen Sie Weiteraus.

    Screenshot showing the Choose data destination dialog with the new lakehouse option selected.

  3. Konfigurieren Sie Ihre Quelldaten, und ordnen Sie sie Ihrem Ziel zu. Wählen Sie dann Weiter aus, um die Zielkonfigurationen abzuschließen.

    Screenshot showing the Connect to data destination dialog in the copy data assistant with the table name MoviesDB filled in.

Schritt 4: Überprüfen und Erstellen der Copy-Aktivität

  1. Überprüfen Sie die Einstellungen Ihrer Copy-Aktivität in den vorherigen Schritten, und wählen Sie „OK“ aus, um den Vorgang abzuschließen. Sie können auch zu den vorherigen Schritten zurückkehren, um Ihre Einstellungen bei Bedarf im Tool zu bearbeiten.

    Screenshot showing the Review + create screen in the Copy data assistant dialog.

  2. Nach Abschluss des Vorgangs wird die Copy-Aktivität Ihrer Datenpipelinecanvas hinzugefügt. Alle Einstellungen, einschließlich erweiterter Einstellungen für diese Copy-Aktivität, sind unter den unten genannten Registerkarten verfügbar, wenn diese ausgewählt sind.

    Screenshot showing the finished Copy activity.

Ausführen und Planen Ihrer Datenpipeline

  1. Wechseln Sie zur Registerkarte Home, und wählen Sie Ausführen aus. Wählen Sie dann Speichern und ausführen aus.

    Screenshot showing the Copy activity's Run button on the Home tab.

    Screenshot showing the Save and run dialog for the Copy activity.

  2. Wählen Sie die Schaltfläche Details aus, um den Fortschritt zu überwachen und die Ergebnisse der Ausführung zu überprüfen.

    Screenshot showing the run Details button.

  3. Das Dialogfeld Datendetails kopieren zeigt die Ergebnisse der Ausführung an, einschließlich des Status, der gelesenen und geschriebenen Datenmenge, der Start- und Endzeiten und der Dauer.

    Screenshot showing the Copy data details dialog.

  4. Sie können die Ausführung der Pipeline auch nach Bedarf mit einer bestimmten Häufigkeit planen. Im Folgenden finden Sie ein Beispiel, um die Ausführung der Pipeline alle 15 Minuten zu planen.

    Screenshot showing the schedule configuration dialog.

    Screenshot showing a pipeline with a configured schedule to run every 15 minutes.

Die Pipeline in diesem Beispiel zeigt, wie Daten aus Azure Blob Storage in Lakehouse kopiert werden. Sie haben Folgendes gelernt:

  • Erstellen Sie eine Datenpipeline.
  • Kopieren Sie Daten mit dem Kopier-Assistenten.
  • Führen Sie Ihre Datenpipeline aus, und planen Sie sie.

Erfahren Sie im nächsten Schritt mehr über die Überwachung Ihrer Pipelineausführungen.