Binärformat für Data Factory in Microsoft Fabric

In diesem Artikel wird beschrieben, wie Sie das Binärformat in Data Factory konfigurieren.

Wichtig

Microsoft Fabric befindet sich derzeit in der VORSCHAU. Diese Informationen beziehen sich auf eine Vorabversion des Produkts, an der vor der Veröffentlichung noch wesentliche Änderungen vorgenommen werden können. Microsoft übernimmt keine Garantie, weder ausdrücklich noch stillschweigend, für die hier bereitgestellten Informationen. Weitere Informationen finden Sie in Azure Data Factory Dokumentation für den Dienst in Azure.

Unterstützte Funktionen

Das Binärformat wird für die folgenden Aktivitäten und Connectors als Quelle und Ziel unterstützt.

Category Connector/Aktivität
Unterstützter Connector Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Google Cloud Storage
HTTP
Unterstützte Aktivität Kopieraktivität
GetMetadata-Aktivität
Delete activity

Binärformat in der Kopieraktivität

Um das Binärformat zu konfigurieren, wählen Sie Ihre Verbindung in der Quelle oder dem Ziel der Kopieraktivität der Datenpipeline aus, und wählen Sie dann in der Dropdownliste Dateiformat die Option Binär aus. Wählen Sie Einstellungen für die weitere Konfiguration dieses Formats aus.

Screenshot der Schaltfläche

Hinweis

Wenn Sie das Binärformat in einer Kopieraktivität verwenden, sollten Quelle und Ziel das Binärformat verwenden.

„Binär“ als Quelle

Nachdem Sie im Abschnitt Dateiformat auf der Registerkarte Quelle die Option Einstellungen ausgewählt haben, werden die folgenden Eigenschaften im Popupdialogfeld Dateiformateinstellungen angezeigt.

Screenshot: Dateiformateinstellungen

  • Komprimierungstyp: Der Komprimierungscodec, der zum Lesen von Binärdateien verwendet wird. Sie können aus den Typen None, bzip2, gzip, deflate, ZipDeflate, TarGzip oder tar in der Dropdownliste wählen.

    Wenn Sie ZipDeflate als Komprimierungstyp auswählen, wird zip-Dateiname als Ordner beibehalten unter den erweiterten Einstellungen auf der Registerkarte Quelle angezeigt.

    • Name der ZIP-Datei als Ordner beibehalten: Gibt an, ob der Zip-Quelldateiname während des Kopiervorgangs als Ordnerstruktur beibehalten werden soll.
      • Wenn dieses Kontrollkästchen aktiviert ist (Standard), schreibt der Dienst entpackte Dateien in <specified file path>/<folder named as source zip file>/.
      • Wenn dieses Kontrollkästchen deaktiviert ist, schreibt der Dienst entzippte Dateien direkt in <specified file path>. Stellen Sie sicher, dass es in unterschiedlichen ZIP-Quelldateien keine doppelten Dateinamen gibt, um Racebedingungen oder unerwartetes Verhalten zu vermeiden.

    Wenn Sie TarGzip/tar als Komprimierungstyp auswählen, wird der Komprimierungsdateiname als Ordner beibehalten unter den erweiterten Einstellungen auf der Registerkarte Quelle angezeigt.

    • Komprimierungsdateiname als Ordner beibehalten: Gibt an, ob der komprimierte Quelldateiname während des Kopiervorgangs als Ordnerstruktur beibehalten werden soll.
      • Wenn dieses Kontrollkästchen aktiviert ist (Standard), schreibt der Dienst dekomprimierte Dateien in <specified file path>/<folder named as source compressed file>/.
      • Wenn dieses Kontrollkästchen deaktiviert ist, schreibt der Dienst dekomprimierte Dateien direkt in <specified file path>. Stellen Sie sicher, dass es in unterschiedlichen ZIP-Quelldateien keine doppelten Dateinamen gibt, um Racebedingungen oder unerwartetes Verhalten zu vermeiden.
  • Komprimierungsebene: Das Komprimierungsverhältnis. Sie können zwischen Optimal oder Schnellster wählen.

    • Schnellster: Der Komprimierungsvorgang sollte so schnell wie möglich abgeschlossen werden, auch wenn die resultierende Datei nicht optimal komprimiert ist.
    • Optimal: Die Daten sollten optimal komprimiert sein, auch wenn der Vorgang eine längere Zeit in Anspruch nimmt. Weitere Informationen findest du im ArtikelKomprimierungsgrad .

Unter Erweiterte Einstellungen auf der Registerkarte Quelle werden weitere Eigenschaften im Zusammenhang mit dem Binärformat angezeigt.

  • Dateien nach Abschluss löschen: Gibt an, ob die Binärdateien nach dem erfolgreichen Wechsel in den Zielspeicher aus dem Quellspeicher gelöscht werden. Der Dateilöschvorgang erfolgt pro Datei. Wenn also eine Kopieraktivität fehlschlägt, wurden einige Dateien bereits in das Ziel kopiert und aus der Quelle gelöscht, während andere weiterhin im Quellspeicher verbleiben.

Binär als Ziel

Nachdem Sie im Abschnitt Dateiformat auf der Registerkarte Ziel die Option Einstellungen ausgewählt haben, werden im Popupdialogfeld Dateiformateinstellungen die folgenden Eigenschaften angezeigt.

Screenshot: Auswählen des Dateiformats

  • Komprimierungstyp: Der Komprimierungscodec, der zum Schreiben von Binärdateien verwendet wird. Sie können aus den Typen None, bzip2, gzip, deflate, ZipDeflate, TarGzip oder tar in der Dropdownliste wählen.

  • Komprimierungsebene: Das Komprimierungsverhältnis. Sie können zwischen Optimal oder Schnellster wählen.

    • Schnellster: Der Komprimierungsvorgang sollte so schnell wie möglich abgeschlossen werden, auch wenn die resultierende Datei nicht optimal komprimiert ist.
    • Optimal: Die Daten sollten optimal komprimiert sein, auch wenn der Vorgang eine längere Zeit in Anspruch nimmt. Weitere Informationen findest du im Artikel Komprimierungsgrad .

Tabellenzusammenfassung

„Binär“ als Quelle

Die folgenden Eigenschaften werden im Abschnitt Quelle der Kopieraktivität unterstützt, wenn Sie das Binärformat verwenden.

Name BESCHREIBUNG Wert Erforderlich JSON-Skripteigenschaft
Dateiformat Das Dateiformat, das Sie verwenden möchten. Binär (Binary) Yes type (unter datasetSettings):
Binär
Komprimierungstyp Der Komprimierungscodec, der zum Lesen von Binärdateien verwendet wird. Folgende Optionen stehen zur Auswahl:
None
BZIP2
Gzip
Deflate
ZipDeflate
TarGzip
Tar
No type (unter compression):

BZIP2
gzip
Deflate
ZipDeflate
TarGzip
tar
Komprimierungsgrad Das Komprimierungsverhältnis. Zulässige Werte sind Optimal oder Sehr schnell. Optimal oder schnellste No level (unter compression):
Sehr schnell
Optimal
Zip-Dateiname als Ordner beibehalten Gibt an, ob der Name der QUELL-ZIP-Datei während des Kopiervorgangs als Ordnerstruktur beibehalten werden soll. Auswahl oder Aufheben der Auswahl Nein preserveZipFileNameAsFolder
(unter compressionProperties->type als ZipDeflateReadSettings)
Komprimierungsdateiname als Ordner beibehalten Gibt an, ob der komprimierte Quelldateiname während des Kopiervorgangs als Ordnerstruktur beibehalten werden soll. Auswahl oder Aufheben der Auswahl Nein preserveCompressionFileNameAsFolder
(unter compressionProperties->type als TarGZipReadSettings oder TarReadSettings)
Löschen von Dateien nach Abschluss Gibt an, ob die Binärdateien nach dem erfolgreichen Wechsel in den Zielspeicher aus dem Quellspeicher gelöscht werden. Auswahl oder Aufheben der Auswahl No deleteFilesAfterCompletion:
true oder false

Binär als Ziel

Die folgenden Eigenschaften werden im Abschnitt Ziel der Kopieraktivität bei Verwendung des Binärformats unterstützt.

Name BESCHREIBUNG Wert Erforderlich JSON-Skripteigenschaft
Dateiformat Das Dateiformat, das Sie verwenden möchten. Binär (Binary) Yes type (unter datasetSettings):
Binär
Komprimierungstyp Der Komprimierungscodec, der zum Schreiben von Binärdateien verwendet wird. Folgende Optionen stehen zur Auswahl:
None
BZIP2
Gzip
Deflate
ZipDeflate
TarGzip
Tar
No type (unter compression):

BZIP2
gzip
Deflate
ZipDeflate
TarGzip
tar
Komprimierungsgrad Das Komprimierungsverhältnis. Zulässige Werte sind Optimal oder Sehr schnell. Optimal oder schnellste No level (unter compression):
Sehr schnell
Optimal

Nächste Schritte