Læs på engelsk

Del via


ORC-format i Data Factory i Microsoft Fabric

I denne artikel beskrives det, hvordan du konfigurerer ORC-format i datapipelinen for Data Factory i Microsoft Fabric.

Understøttede funktioner

ORC-format understøttes for følgende aktiviteter og forbindelser som kilde og destination.

ORC-format i kopiaktivitet

Hvis du vil konfigurere ORC-format, skal du vælge din forbindelse i kilden eller destinationen for kopieringsaktiviteten for datapipelinen og derefter vælge ORC på rullelisten i Filformat. Vælg Indstillinger for yderligere konfiguration af dette format.

Skærmbillede, der viser indstillinger for filformat.

ORC-format som kilde

Når du har valgt Indstillinger i afsnittet Filformat, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.

Skærmbillede, der viser kilden til ORC-filformatet.

  • Komprimeringstype: Vælg det komprimeringscodec, der skal bruges til at læse ORC-filer på rullelisten. Du kan vælge mellem Ingen, zlib eller snappy.

ORC-format som destination

Når du har valgt Indstillinger, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.

Skærmbillede, der viser destinationen for ORC-filformatet.

  • Komprimeringstype: Vælg det komprimeringscodec, der skal bruges til at skrive ORC-filer på rullelisten. Du kan vælge mellem Ingen, zlib eller snappy.

Under Avancerede indstillinger under fanen Destination vises følgende ORC-formatrelaterede egenskaber.

  • Maksimalt antal rækker pr. fil: Når du skriver data til en mappe, kan du vælge at skrive til flere filer og angive det maksimale antal rækker pr. fil. Angiv det maksimale antal rækker, du vil skrive pr. fil.
  • Præfiks for filnavn: Gælder, når der er konfigureret maks. rækker pr. fil . Angiv præfikset for filnavnet, når du skriver data til flere filer, hvilket resulterede i dette mønster: <fileNamePrefix>_00000.<fileExtension>. Hvis det ikke er angivet, oprettes præfikset for filnavnet automatisk. Denne egenskab gælder ikke, når kilden er et filbaseret lager eller et partitionsindstillingsaktiveret datalager.

Tabeloversigt

ORC som kilde

Følgende egenskaber understøttes i afsnittet kopiaktivitetskilde, når du bruger ORC-format.

Navn Beskrivelse Værdi Obligatorisk JSON-scriptegenskab
Filformat Det filformat, du vil bruge. ORK Ja type (under datasetSettings):
Ork
Komprimeringstype Den komprimeringscodec, der bruges til at læse ORC-filer. Ingen
zlib
Bidsk
Nr. orcCompressionCodec:
ingen
zlib
Bidsk

ORC som destination

Følgende egenskaber understøttes i afsnittet Destination for kopiaktivitet, når DU bruger ORC-formatet.

Navn Beskrivelse Værdi Obligatorisk JSON-scriptegenskab
Filformat Det filformat, du vil bruge. ORK Ja type (under datasetSettings):
Ork
Komprimeringstype Den komprimeringscodec, der bruges til at skrive ORC-filer. Ingen
zlib
Bidsk
Nr. orcCompressionCodec:
ingen
zlib
Bidsk
Maks. antal rækker pr. fil Når du skriver data til en mappe, kan du vælge at skrive til flere filer og angive det maksimale antal rækker pr. fil. Angiv det maksimale antal rækker, du vil skrive pr. fil. <dine maksimale rækker pr. fil> Nr. maxRowsPerFile
Præfiks for filnavn Gælder, når der er konfigureret maks. rækker pr. fil . Angiv præfikset for filnavnet, når du skriver data til flere filer, hvilket resulterede i dette mønster: <fileNamePrefix>_00000.<fileExtension>. Hvis det ikke er angivet, oprettes præfikset for filnavnet automatisk. Denne egenskab gælder ikke, når kilden er et filbaseret lager eller et partitionsindstillingsaktiveret datalager. <præfikset for filnavnet> Nr. fileNamePrefix