Massenkopieren von Dateien in eine Datenbank

GILT FÜR: Azure Data Factory Azure Synapse Analytics

In diesem Artikel wird eine Lösungsvorlage beschrieben, die Sie zum Massenkopieren von Daten aus Azure Data Lake Storage Gen2 nach Azure Synapse Analytics/Azure SQL-Datenbank verwenden können.

Informationen zu dieser Lösungsvorlage

Mit dieser Vorlage werden Dateien aus der Azure Data Lake Storage Gen2-Quelle abgerufen. Anschließend wird jede Datei in der Quelle durchlaufen, und die Daten werden in den Zieldatenspeicher kopiert.

Diese Vorlage unterstützt derzeit nur das Kopieren von Daten im DelimitedText-Format. Dateien mit anderen Datenformaten können ebenfalls aus dem Quelldatenspeicher abgerufen werden, sie können jedoch nicht in den Zieldatenspeicher kopiert werden.

Die Vorlage enthält drei Aktivitäten:

  • Die Aktivität Metadaten abrufen ruft Dateien aus Azure Data Lake Storage Gen2 ab und übergibt sie an die nachfolgende ForEach-Aktivität.
  • Die ForEach-Aktivität ruft Dateien aus der Aktivität Metadaten abrufen ab und durchläuft jede Datei mit der Aktivität Kopieren.
  • Die Aktivität Kopieren befindet sich innerhalb der ForEach-Aktivität, damit jede Datei aus dem Quelldatenspeicher in den Zieldatenspeicher kopiert werden kann.

Die Vorlage definiert die folgenden beiden Parameter:

  • SourceContainer ist der Stammcontainerpfad, in den die Daten in Ihrer Azure Data Lake Storage Gen2-Instanz kopiert werden.
  • SourceDirectory ist der Verzeichnispfad im Stammcontainer, in den die Daten aus Ihrer Azure Data Lake Storage Gen2-Instanz kopiert werden.

So verwenden Sie diese Lösungsvorlage

  1. Öffnen Sie das Azure Data Factory Studio, und wählen Sie die Registerkarte "Autor" mit dem Bleistiftsymbol aus.

  2. Zeigen Sie auf den Abschnitt "Pipelines ", und wählen Sie die Auslassungspunkte aus, die auf der rechten Seite angezeigt werden. Wählen Sie dann "Pipeline" aus der Vorlage aus. Screenshot der Benutzeroberfläche der Data Factory mit der Schaltfläche

  3. Wählen Sie die Massenkopie aus Dateien in Datenbankvorlage aus, und wählen Sie dann "Weiter" aus. Screenshot der Massenkopiendateien in Datenbankvorlage im Vorlagenbrowser.

  4. Erstellen Sie eine neue Verbindung mit dem Quell-Gen2-Speicher als Quelle und eine mit der Datenbank für Ihre Spüle. Wählen Sie dann "Diese Vorlage verwenden" aus.

    Screenshot des Vorlagen-Editors mit hervorgehobenen Quell- und Sinkdatenquellen.

  5. Eine neue Pipeline wird wie im folgenden Beispiel dargestellt erstellt:

    Überprüfen der Pipeline

  6. Klicken Sie auf Debuggen, geben Sie die Parameter ein, und klicken Sie dann auf Fertig stellen.

    Auf **Debuggen** klicken

  7. Wenn die Pipelineausführung erfolgreich abgeschlossen wurde, werden die Ergebnisse ähnlich wie im nachstehenden Beispiel angezeigt:

    Überprüfen des Ergebnisses

Nächste Schritte