ORC-format i Data Factory i Microsoft Fabric

Den här artikeln beskriver hur du konfigurerar ORC-format i datapipelinen för Data Factory i Microsoft Fabric.

Funktioner som stöds

ORC-format stöds för följande aktiviteter och anslutningsappar som källa och mål.

Kategori Anslut eller/aktivitet
Anslutningsprogram som stöds Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
FTP
Google Cloud Storage
HTTP
SFTP
Aktivitet som stöds aktiviteten Kopiera
Sökningsaktivitet
GetMetadata-aktivitet
Ta bort dataaktivitet

ORC-format i kopieringsaktivitet

Om du vill konfigurera ORC-format väljer du din anslutning i källan eller målet för kopieringsaktiviteten för datapipelinen och väljer sedan ORC i listrutan filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.

Screenshot showing file format settings.

ORC-format som källa

När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.

Screenshot showing ORC file format source.

  • Komprimeringstyp: Välj den komprimeringskodc som används för att läsa ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.

ORC-format som mål

När du har valt Inställningar visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.

Screenshot showing ORC file format destination.

  • Komprimeringstyp: Välj den komprimeringskodc som används för att skriva ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.

Under Avancerade inställningar på fliken Mål visas följande ORC-formatrelaterade egenskaper.

  • Maximalt antal rader per fil: När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil.
  • Filnamnsprefix: Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret: <fileNamePrefix>_00000.<fileExtension>. Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager.

Tabellsammanfattning

ORC som källa

Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder ORC-format.

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Filformat Det filformat som du vill använda. ORC Ja typ (under datasetSettings):
Orc
Komprimeringstyp Komprimeringskodcen som används för att läsa ORC-filer. None
Zlib
Snappy
Nej orcCompressionCodec:
inget
Zlib
Snappy

ORC som mål

Följande egenskaper stöds i avsnittet Mål för kopieringsaktivitet när du använder ORC-formatet.

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Filformat Det filformat som du vill använda. ORC Ja typ (under datasetSettings):
Orc
Komprimeringstyp Komprimeringskodcen som används för att skriva ORC-filer. None
Zlib
Snappy
Nej orcCompressionCodec:
inget
Zlib
Snappy
Maximalt antal rader per fil När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil. <maximalt antal rader per fil> Nej maxRowsPerFile
Filnamnsprefix Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret: <fileNamePrefix>_00000.<fileExtension>. Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager. <ditt filnamnsprefix> Nej fileNamePrefix