ORC formátum a Data Factoryben a Microsoft Fabricben
Ez a cikk bemutatja, hogyan konfigurálhatja az ORC formátumot a Data Factory adatfolyamában a Microsoft Fabricben.
Támogatott képességek
Az ORC formátum a következő tevékenységekhez és összekötőkhöz támogatott forrásként és célként.
Kategória | Összekötő/tevékenység |
---|---|
Támogatott összekötő | Amazon S3 |
Amazon S3 kompatibilis | |
Azure Blob Storage | |
1. generációs Azure Data Lake Storage | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Fájlrendszer | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Támogatott tevékenység | Copy tevékenység (forrás/cél) |
Keresési tevékenység | |
GetMetadata-tevékenység | |
Adattevékenység törlése |
ORC formátum másolási tevékenységben
Az ORC formátum konfigurálásához válassza ki a kapcsolatot az adatfolyam-másolási tevékenység forrásában vagy célhelyén, majd válassza az ORC lehetőséget a Fájlformátum legördülő listájában. A formátum további konfigurálásához válassza a Beállítások lehetőséget .
ORC formátum forrásként
Miután kiválasztotta a Beállítások lehetőséget a Fájlformátum szakaszban, a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.
- Tömörítés típusa: Válassza ki az ORC-fájlok olvasásához használt tömörítési kodeket a legördülő listában. A Nincs, a zlib vagy a Snappy lehetőség közül választhat.
ORC formátum célként
A Beállítások kiválasztása után a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.
- Tömörítés típusa: Válassza ki az ORC-fájlok írásához használt tömörítési kodeket a legördülő listában. A Nincs, a zlib vagy a Snappy lehetőség közül választhat.
A Cél lapon a Speciális beállítások területen a következő ORC-formátumhoz kapcsolódó tulajdonságok jelennek meg.
- Fájlonkénti sorok maximális száma: Ha adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti sorok maximális számát. Adja meg a fájlonként írni kívánt sorok maximális számát.
- Fájlnév előtagja: Akkor alkalmazható, ha a fájlonkénti sorok maximális száma konfigurálva van. Adja meg a fájlnév előtagot, amikor több fájlba ír adatokat, és a következő mintát eredményezte:
<fileNamePrefix>_00000.<fileExtension>
. Ha nincs megadva, a fájlnév előtagja automatikusan létrejön. Ez a tulajdonság nem érvényes, ha a forrás fájlalapú tároló vagy partícióbeállítás-kompatibilis adattár.
Táblázat összefoglalása
ORC forrásként
A másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak ORC formátumban.
Név | Leírás | Érték | Szükséges | JSON-szkripttulajdonság |
---|---|---|---|---|
Fájlformátum | A használni kívánt fájlformátum. | ORK | Igen | típus (alatt datasetSettings ):Ork |
Tömörítés típusa | Az ORC-fájlok olvasásához használt tömörítési kodek. | Egyik sem zlib rámenős |
Nem | orcCompressionCodec: Nincs zlib rámenős |
ORC célként
Az ORC formátum használatakor a másolási tevékenység Cél szakasza az alábbi tulajdonságokat támogatja.
Név | Leírás | Érték | Szükséges | JSON-szkripttulajdonság |
---|---|---|---|---|
Fájlformátum | A használni kívánt fájlformátum. | ORK | Igen | típus (alatt datasetSettings ):Ork |
Tömörítés típusa | Az ORC-fájlok írásához használt tömörítési kodek. | Egyik sem zlib rámenős |
Nem | orcCompressionCodec: Nincs zlib rámenős |
Sorok maximális száma fájlonként | Ha adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti maximális sorokat. Adja meg a fájlonként írni kívánt sorok maximális számát. | <a maximális sorok száma fájlonként> | Nem | maxRowsPerFile |
Fájlnév előtagja | Akkor alkalmazható, ha a fájlonkénti sorok maximális száma van konfigurálva. Adja meg a fájlnév előtagot, amikor több fájlba ír adatokat, és a következő mintát eredményezte: <fileNamePrefix>_00000.<fileExtension> . Ha nincs megadva, a fájlnév előtagja automatikusan létrejön. Ez a tulajdonság nem érvényes, ha a forrás fájlalapú tároló vagy partícióbeállítás-kompatibilis adattár. |
<a fájlnév előtagja> | Nem | fileNamePrefix |