ORC-format i Data Factory i Microsoft Fabric
Den här artikeln beskriver hur du konfigurerar ORC-format i datapipelinen för Data Factory i Microsoft Fabric.
ORC-format stöds för följande aktiviteter och anslutningsappar som källa och mål.
Kategori | Anslutningsapp/aktivitet |
---|---|
Anslutningsprogram som stöds | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-filer | |
Oracle Cloud Storage | |
SFTP | |
Aktivitet som stöds | aktiviteten Kopiera (källa/mål) |
Sökningsaktivitet | |
GetMetadata-aktivitet | |
Ta bort dataaktivitet |
Om du vill konfigurera ORC-format väljer du din anslutning i källan eller målet för kopieringsaktiviteten för datapipelinen och väljer sedan ORC i listrutan filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.
När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.
- Komprimeringstyp: Välj den komprimeringskodc som används för att läsa ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.
När du har valt Inställningar visas följande egenskaper i dialogrutan inställningar för filformat i popup-fönstret.
- Komprimeringstyp: Välj den komprimeringskodc som används för att skriva ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.
Under Avancerade inställningar på fliken Mål visas följande ORC-formatrelaterade egenskaper.
- Maximalt antal rader per fil: När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil.
- Filnamnsprefix: Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret:
<fileNamePrefix>_00000.<fileExtension>
. Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager.
Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder ORC-format.
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Det filformat som du vill använda. | ORCH | Ja | typ (under datasetSettings ):Orch |
Komprimeringstyp | Komprimeringskodcen som används för att läsa ORC-filer. | None zlib kvick |
Nej | orcCompressionCodec: inget zlib kvick |
Följande egenskaper stöds i avsnittet Mål för kopieringsaktivitet när du använder ORC-formatet.
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Det filformat som du vill använda. | ORCH | Ja | typ (under datasetSettings ):Orch |
Komprimeringstyp | Komprimeringskodcen som används för att skriva ORC-filer. | None zlib kvick |
Nej | orcCompressionCodec: inget zlib kvick |
Maximalt antal rader per fil | När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil. | <maximalt antal rader per fil> | Nej | maxRowsPerFile |
Filnamnsprefix | Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret: <fileNamePrefix>_00000.<fileExtension> . Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager. |
<ditt filnamnsprefix> | Nej | fileNamePrefix |