Freigeben über


Erste Schritte mit Azure Data Factory

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie eine neue Testversion kostenlos starten können!

Willkommen bei Azure Data Factory! Dieser Artikel hilft Ihnen, Ihre erste Datenfabrik und Pipeline in nur fünf Minuten zu erstellen.

Die Azure Resource Manager-Vorlage (ARM-Vorlage) in diesem Artikel erstellt und konfiguriert alles, was Sie benötigen. Anschließend können Sie zu Ihrer Demodatenfactory wechseln und die Pipeline auslösen, wodurch einige Beispieldaten aus einem Azure Blob Storage-Ordner in einen anderen verschoben werden.

Voraussetzungen

Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.

Videozusammenfassung

Das folgende Video enthält eine exemplarische Vorgehensweise für das Beispiel in diesem Artikel:

Schritt 1: Verwenden der Demo zum Erstellen von Ressourcen

In diesem Demoszenario verwenden Sie die Kopieraktivität in einer Datenfactory, um ein Blob namens moviesDB2.csv aus einem Eingabeordner in Azure Blob Storage in einen Ausgabeordner zu kopieren. In einem realen Szenario könnte diese Copy-Aktivität zwischen einer der vielen unterstützten Datenquellen und -senken erfolgen, die im Dienst verfügbar sind. Die Daten können zudem transformiert werden.

  1. Wählen Sie die folgende Schaltfläche aus.

    Testen Sie Ihre erste Data Factory-Demo

    Durch Auswählen der Schaltfläche werden die folgenden Azure-Ressourcen erstellt:

    • Ein Azure Data Factory-Konto
    • Eine Datenfabrik, die eine Pipeline mit einer Kopieraktivität enthält
    • Ein Azure-Blobspeicherkonto mit moviesDB2.csv, das in einen Eingabeordner als Quelle hochgeladen wird
    • Ein verknüpfter Dienst zur Verbindung der Datenfabrik mit Blob-Speicher
  2. Sie werden zur Konfigurationsseite weitergeleitet, um die Vorlage bereitzustellen. Auf dieser Seite:

    1. Wählen Sie für die Ressourcengruppe " Neu erstellen" aus, um eine Ressourcengruppe zu erstellen. Sie können alle anderen Werte mit ihren Standardwerten belassen.

    2. Wählen Sie "Überprüfen" und "Erstellen" und dann " Erstellen" aus, um die Ressourcen bereitzustellen.

    Screenshot der Seite zum Bereitstellen einer Vorlage für die Erstellung von Ressourcen.

Hinweis

Der Benutzer, der die Vorlage bereitstellt, muss einer verwalteten Identität eine Rolle zuweisen. Dieser Schritt erfordert Berechtigungen, die über die Rolle "Besitzer", "Benutzerzugriffsadministrator" oder "Verwalteter Identitätsoperator" erteilt werden können.

Alle Ressourcen in dieser Demo werden in der neuen Ressourcengruppe erstellt, sodass Sie sie später problemlos bereinigen können.

Schritt 2: Überprüfen der bereitgestellten Ressourcen

  1. Wählen Sie in der Meldung, die den erfolgreichen Abschluss Ihrer Bereitstellung anzeigt, die Option "Zur Ressourcengruppe wechseln" aus.

    Screenshot der Azure-Portalseite, die eine erfolgreiche Bereitstellung der Demovorlage zeigt.

  2. Die Ressourcengruppe enthält die neue Data Factory, das Blob-Speicherkonto und die verwaltete Identität, die die Bereitstellung erstellt hat. Wählen Sie die Data Factory in der Ressourcengruppe aus, um sie anzuzeigen.

    Screenshot des Inhalts der für die Demo erstellten Ressourcengruppe, wobei die Data Factory hervorgehoben ist.

  3. Wählen Sie die Schaltfläche "Studio starten " aus.

    Screenshot des Azure-Portals, das Details zur neu erstellten Datenfabrik zeigt, wobei die Schaltfläche zum Öffnen von Azure Data Factory Studio hervorgehoben ist.

  4. In Azure Data Factory Studio:

    1. Wählen Sie die Registerkarte AutorRegisterkarte aus.
    2. Wählen Sie die Pipeline aus, die mithilfe der Vorlage erstellt wurde.
    3. Überprüfen Sie die Quelldaten, indem Sie "Öffnen" auswählen.

    Screenshot von Azure Data Factory Studio, das die von der Vorlage erstellte Pipeline zeigt.

  5. Wählen Sie im Quelldatensatz " Durchsuchen" aus, um die für die Demo erstellte Eingabedatei anzuzeigen.

    Screenshot des Quelldatensets mit hervorgehobener Schaltfläche

    Beachten Sie die moviesDB2.csv Datei, die bereits in den Eingabeordner hochgeladen wurde.

    Screenshot des Inhalts des Eingabeordners, der die in der Demo verwendete Eingabedatei zeigt.

Schritt 3: Auslösen der Ausführung der Demopipeline

  1. Wählen Sie "Trigger hinzufügen" und dann "Jetzt auslösen" aus.

    Screenshot der Schaltfläche für die Ausführung der Demopipeline.

  2. Wählen Sie im rechten Bereich unter "Pipeline ausführen" "OK" aus.

Überwachen der Pipeline

  1. Wählen Sie die Registerkarte ÜberwachenRegisterkarte „Überwachen“ aus. Dieser Tab bietet eine Übersicht über Ihre Pipeline-Durchläufe, einschließlich der Startzeit und des Status.

    Screenshot: Registerkarte zur Überwachung von Pipelineausführungen in einer Data Factory.

  2. In dieser Schnellstartanleitung hat die Pipeline nur einen Aktivitätstyp: Daten kopieren. Wählen Sie den Pipelinenamen aus, um die Details der Ausführungsergebnisse der Copy-Aktivität anzuzeigen.

    Screenshot: Ausführungsergebnisse einer Copy-Aktivität auf der Registerkarte zum Überwachen einer Data Factory.

  3. Wählen Sie das Symbol "Details " aus, um den detaillierten Kopiervorgang anzuzeigen. In den Ergebnissen sind die Größen Daten gelesen und Daten geschrieben identisch, und eine Datei wurde gelesen und geschrieben. Diese Informationen belegen, dass alle Daten erfolgreich an das Ziel kopiert wurden.

    Screenshot der detaillierten Ausführungsergebnisse für eine Kopieraktivität.

Bereinigen von Ressourcen

Sie können alle ressourcen, die Sie in diesem Artikel erstellt haben, auf zwei Arten bereinigen:

  • Sie können die gesamte Azure-Ressourcengruppe löschen, in der alle erstellten Ressourcen enthalten sind.

  • Wenn Sie einige Ressourcen beibehalten möchten, wechseln Sie zur Ressourcengruppe, und löschen Sie nur die spezifischen Ressourcen, die Sie entfernen möchten.

    Wenn Sie beispielsweise diese Vorlage zum Erstellen einer Datenfactory für die Verwendung in einem anderen Lernprogramm verwenden, können Sie die anderen Ressourcen löschen, aber nur die Datenfactory beibehalten.

In diesem Artikel haben Sie eine Data Factory erstellt, die eine Pipeline mit einer Copy-Aktivität enthielt. Weitere Informationen zu Azure Data Factory finden Sie im folgenden Artikel und Schulungsmodul: