Megosztás a következőn keresztül:


ORC formátum a Data Factoryben a Microsoft Fabricben

Ez a cikk bemutatja, hogyan konfigurálhatja az ORC formátumot a Data Factory adatfolyamában a Microsoft Fabricben.

Támogatott képességek

Az ORC formátum a következő tevékenységekhez és összekötőkhöz támogatott forrásként és célként.

Kategória Összekötő/tevékenység
Támogatott összekötő Amazon S3
Amazon S3 kompatibilis
Azure Blob Storage
1. generációs Azure Data Lake Storage
Azure Data Lake Storage Gen2
Azure Files
Fájlrendszer
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Oracle Cloud Storage
SFTP
Támogatott tevékenység Copy tevékenység (forrás/cél)
Keresési tevékenység
GetMetadata-tevékenység
Adattevékenység törlése

ORC formátum másolási tevékenységben

Az ORC formátum konfigurálásához válassza ki a kapcsolatot az adatfolyam-másolási tevékenység forrásában vagy célhelyén, majd válassza az ORC lehetőséget a Fájlformátum legördülő listájában. A formátum további konfigurálásához válassza a Beállítások lehetőséget .

Képernyőkép a fájlformátum beállításairól.

ORC formátum forrásként

Miután kiválasztotta a Beállítások lehetőséget a Fájlformátum szakaszban, a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.

Az ORC fájlformátum forrását bemutató képernyőkép.

  • Tömörítés típusa: Válassza ki az ORC-fájlok olvasásához használt tömörítési kodeket a legördülő listában. A Nincs, a zlib vagy a Snappy lehetőség közül választhat.

ORC formátum célként

A Beállítások kiválasztása után a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.

Az ORC fájlformátum célhelyét bemutató képernyőkép.

  • Tömörítés típusa: Válassza ki az ORC-fájlok írásához használt tömörítési kodeket a legördülő listában. A Nincs, a zlib vagy a Snappy lehetőség közül választhat.

A Cél lapon a Speciális beállítások területen a következő ORC-formátumhoz kapcsolódó tulajdonságok jelennek meg.

  • Fájlonkénti sorok maximális száma: Ha adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti sorok maximális számát. Adja meg a fájlonként írni kívánt sorok maximális számát.
  • Fájlnév előtagja: Akkor alkalmazható, ha a fájlonkénti sorok maximális száma konfigurálva van. Adja meg a fájlnév előtagot, amikor több fájlba ír adatokat, és a következő mintát eredményezte: <fileNamePrefix>_00000.<fileExtension>. Ha nincs megadva, a fájlnév előtagja automatikusan létrejön. Ez a tulajdonság nem érvényes, ha a forrás fájlalapú tároló vagy partícióbeállítás-kompatibilis adattár.

Táblázat összefoglalása

ORC forrásként

A másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak ORC formátumban.

Név Leírás Érték Szükséges JSON-szkripttulajdonság
Fájlformátum A használni kívánt fájlformátum. ORK Igen típus (alatt datasetSettings):
Ork
Tömörítés típusa Az ORC-fájlok olvasásához használt tömörítési kodek. Egyik sem
zlib
rámenős
Nem orcCompressionCodec:
Nincs
zlib
rámenős

ORC célként

Az ORC formátum használatakor a másolási tevékenység Cél szakasza az alábbi tulajdonságokat támogatja.

Név Leírás Érték Szükséges JSON-szkripttulajdonság
Fájlformátum A használni kívánt fájlformátum. ORK Igen típus (alatt datasetSettings):
Ork
Tömörítés típusa Az ORC-fájlok írásához használt tömörítési kodek. Egyik sem
zlib
rámenős
Nem orcCompressionCodec:
Nincs
zlib
rámenős
Sorok maximális száma fájlonként Ha adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti maximális sorokat. Adja meg a fájlonként írni kívánt sorok maximális számát. <a maximális sorok száma fájlonként> Nem maxRowsPerFile
Fájlnév előtagja Akkor alkalmazható, ha a fájlonkénti sorok maximális száma van konfigurálva. Adja meg a fájlnév előtagot, amikor több fájlba ír adatokat, és a következő mintát eredményezte: <fileNamePrefix>_00000.<fileExtension>. Ha nincs megadva, a fájlnév előtagja automatikusan létrejön. Ez a tulajdonság nem érvényes, ha a forrás fájlalapú tároló vagy partícióbeállítás-kompatibilis adattár. <a fájlnév előtagja> Nem fileNamePrefix