Delen via


ORC-indeling in Data Factory in Microsoft Fabric

In dit artikel wordt beschreven hoe u orc-indeling configureert in de gegevenspijplijn van Data Factory in Microsoft Fabric.

Ondersteunde mogelijkheden

ORC-indeling wordt ondersteund voor de volgende activiteiten en connectors als bron en doel.

Categorie Connector/activiteit
Ondersteunde connector Amazon S3
Amazon S3 compatibel
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Bestandssysteem
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Oracle Cloud Storage
SFTP
Ondersteunde activiteit Copy-activiteit (bron/doel)
Activiteit Lookup
GetMetadata-activiteit
Gegevensactiviteit verwijderen

ORC-indeling in kopieeractiviteit

Als u DE ORC-indeling wilt configureren, kiest u de verbinding in de bron of het doel van de kopieeractiviteit van de gegevenspijplijn en selecteert u ORC in de vervolgkeuzelijst met de bestandsindeling. Selecteer Instellingen voor verdere configuratie van deze indeling.

Schermopname van de instellingen voor de bestandsindeling.

ORC-indeling als bron

Nadat u Instellingen in de sectie Bestandsindeling hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.

Schermopname van de bron van de ORC-bestandsindeling.

  • Compressietype: kies de compressiecodec die wordt gebruikt voor het lezen van ORC-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, zlib of snappy.

ORC-indeling als doel

Nadat u Instellingen hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.

Schermopname van de ORC-bestandsindelingsbestemming.

  • Compressietype: kies de compressiecodec die wordt gebruikt voor het schrijven van ORC-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, zlib of snappy.

Onder Geavanceerde instellingen op het tabblad Bestemming worden de volgende eigenschappen van de ORC-indeling weergegeven.

  • Maximum aantal rijen per bestand: bij het schrijven van gegevens in een map kunt u ervoor kiezen om naar meerdere bestanden te schrijven en de maximumrijen per bestand op te geven. Geef de maximumrijen op die u per bestand wilt schrijven.
  • Bestandsnaamvoorvoegsel: van toepassing wanneer maximumrijen per bestand is geconfigureerd. Geef het voorvoegsel voor de bestandsnaam op bij het schrijven van gegevens naar meerdere bestanden, wat resulteert in dit patroon: <fileNamePrefix>_00000.<fileExtension> Als dit niet is opgegeven, wordt het voorvoegsel van de bestandsnaam automatisch gegenereerd. Deze eigenschap is niet van toepassing wanneer de bron een archief is op basis van bestanden of een partitieoptie ingeschakeld gegevensarchief.

Tabelsamenvatting

ORC als bron

De volgende eigenschappen worden ondersteund in de sectie Bron van kopieeractiviteit wanneer u DE ORC-indeling gebruikt.

Name Beschrijving Waarde Vereist JSON-scripteigenschap
Bestandsindeling De bestandsindeling die u wilt gebruiken. ORK Ja type (onder datasetSettings):
Ork
Compressietype De compressiecodec die wordt gebruikt om ORC-bestanden te lezen. Geen
zlib
bits
Nee orcCompressionCodec:
Geen
zlib
bits

ORC als bestemming

De volgende eigenschappen worden ondersteund in de sectie Doel van de kopieeractiviteit wanneer u de ORC-indeling gebruikt.

Name Beschrijving Waarde Vereist JSON-scripteigenschap
Bestandsindeling De bestandsindeling die u wilt gebruiken. ORK Ja type (onder datasetSettings):
Ork
Compressietype De compressiecodec die wordt gebruikt voor het schrijven van ORC-bestanden. Geen
zlib
bits
Nee orcCompressionCodec:
Geen
zlib
bits
Maximum aantal rijen per bestand Wanneer u gegevens in een map schrijft, kunt u ervoor kiezen om naar meerdere bestanden te schrijven en de maximumrijen per bestand op te geven. Geef de maximumrijen op die u per bestand wilt schrijven. <uw maximum aantal rijen per bestand> Nee maxRowsPerFile
Bestandsnaamvoorvoegsel Van toepassing wanneer maximumrijen per bestand zijn geconfigureerd. Geef het voorvoegsel voor de bestandsnaam op bij het schrijven van gegevens naar meerdere bestanden, wat resulteert in dit patroon: <fileNamePrefix>_00000.<fileExtension> Als dit niet is opgegeven, wordt het voorvoegsel van de bestandsnaam automatisch gegenereerd. Deze eigenschap is niet van toepassing wanneer de bron een archief is op basis van bestanden of een partitieoptie ingeschakeld gegevensarchief. <uw bestandsnaamvoorvoegsel> Nee fileNamePrefix