ORC-indeling in Data Factory in Microsoft Fabric
In dit artikel wordt beschreven hoe u orc-indeling configureert in de gegevenspijplijn van Data Factory in Microsoft Fabric.
ORC-indeling wordt ondersteund voor de volgende activiteiten en connectors als bron en doel.
Categorie | Connector/activiteit |
---|---|
Ondersteunde connector | Amazon S3 |
Amazon S3 compatibel | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Bestandssysteem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Ondersteunde activiteit | Copy-activiteit (bron/doel) |
Activiteit Lookup | |
GetMetadata-activiteit | |
Gegevensactiviteit verwijderen |
Als u DE ORC-indeling wilt configureren, kiest u de verbinding in de bron of het doel van de kopieeractiviteit van de gegevenspijplijn en selecteert u ORC in de vervolgkeuzelijst met de bestandsindeling. Selecteer Instellingen voor verdere configuratie van deze indeling.
Nadat u Instellingen in de sectie Bestandsindeling hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.
- Compressietype: kies de compressiecodec die wordt gebruikt voor het lezen van ORC-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, zlib of snappy.
Nadat u Instellingen hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.
- Compressietype: kies de compressiecodec die wordt gebruikt voor het schrijven van ORC-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, zlib of snappy.
Onder Geavanceerde instellingen op het tabblad Bestemming worden de volgende eigenschappen van de ORC-indeling weergegeven.
- Maximum aantal rijen per bestand: bij het schrijven van gegevens in een map kunt u ervoor kiezen om naar meerdere bestanden te schrijven en de maximumrijen per bestand op te geven. Geef de maximumrijen op die u per bestand wilt schrijven.
- Bestandsnaamvoorvoegsel: van toepassing wanneer maximumrijen per bestand is geconfigureerd. Geef het voorvoegsel voor de bestandsnaam op bij het schrijven van gegevens naar meerdere bestanden, wat resulteert in dit patroon:
<fileNamePrefix>_00000.<fileExtension>
Als dit niet is opgegeven, wordt het voorvoegsel van de bestandsnaam automatisch gegenereerd. Deze eigenschap is niet van toepassing wanneer de bron een archief is op basis van bestanden of een partitieoptie ingeschakeld gegevensarchief.
De volgende eigenschappen worden ondersteund in de sectie Bron van kopieeractiviteit wanneer u DE ORC-indeling gebruikt.
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Bestandsindeling | De bestandsindeling die u wilt gebruiken. | ORK | Ja | type (onder datasetSettings ):Ork |
Compressietype | De compressiecodec die wordt gebruikt om ORC-bestanden te lezen. | Geen zlib bits |
Nee | orcCompressionCodec: Geen zlib bits |
De volgende eigenschappen worden ondersteund in de sectie Doel van de kopieeractiviteit wanneer u de ORC-indeling gebruikt.
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Bestandsindeling | De bestandsindeling die u wilt gebruiken. | ORK | Ja | type (onder datasetSettings ):Ork |
Compressietype | De compressiecodec die wordt gebruikt voor het schrijven van ORC-bestanden. | Geen zlib bits |
Nee | orcCompressionCodec: Geen zlib bits |
Maximum aantal rijen per bestand | Wanneer u gegevens in een map schrijft, kunt u ervoor kiezen om naar meerdere bestanden te schrijven en de maximumrijen per bestand op te geven. Geef de maximumrijen op die u per bestand wilt schrijven. | <uw maximum aantal rijen per bestand> | Nee | maxRowsPerFile |
Bestandsnaamvoorvoegsel | Van toepassing wanneer maximumrijen per bestand zijn geconfigureerd. Geef het voorvoegsel voor de bestandsnaam op bij het schrijven van gegevens naar meerdere bestanden, wat resulteert in dit patroon: <fileNamePrefix>_00000.<fileExtension> Als dit niet is opgegeven, wordt het voorvoegsel van de bestandsnaam automatisch gegenereerd. Deze eigenschap is niet van toepassing wanneer de bron een archief is op basis van bestanden of een partitieoptie ingeschakeld gegevensarchief. |
<uw bestandsnaamvoorvoegsel> | Nee | fileNamePrefix |