ORC-muoto Data Factoryssa Microsoft Fabricissa
Tässä artikkelissa kerrotaan, miten voit määrittää ORC-muodon Microsoft Fabricin Data Factoryn tietoputkessa.
ORC-muotoa tuetaan seuraavissa toiminnoissa ja liittimillä lähteenä ja kohdesijaintina.
Luokka | Liitin/toiminta |
---|---|
Tuettu liitin | Amazon S3 |
Amazon S3 -yhteensopiva | |
Azure Blob -säilö | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Tiedostojärjestelmä | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-tiedostot | |
Oracle Cloud Storage | |
SFTP | |
Tuettu toiminta | Aktiviteetin kopioiminen (lähde/kohde) |
Hakutoiminta | |
GetMetadata-toiminta | |
Tietojen aktiviteetin poistaminen |
Jos haluat määrittää ORC-muodon, valitse yhteytesi tietoputken kopiointitoiminnon lähteessä tai kohdesijainnissa ja valitse sitten ORC tiedostomuodon avattavasta luettelosta. Valitse Asetukset , jos haluat muuttaa tämän muodon määritystä.
Kun valitset Tiedostomuoto-osiossa Asetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.
- Pakkaustyyppi: Valitse avattavasta luettelosta ORC-tiedostojen lukuun käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään, zlib tai snappy.
Kun olet valinnut Asetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.
- Pakkaustyyppi: Valitse avattavasta luettelosta ORC-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään, zlib tai snappy.
Kohde-välilehden Lisäasetukset-kohdassa näytetään seuraavat ORC-muotoiluun liittyvät ominaisuudet.
- Rivien enimmäismäärä tiedostoa kohden: Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän. Määritä kaikki rivit, jotka haluat kirjoittaa tiedostoa kohden.
- Tiedostonimen etuliite: Käytettävissä, kun määritetään rivien enimmäismäärä tiedostoa kohden. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli:
<fileNamePrefix>_00000.<fileExtension>
. Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö.
Seuraavia ominaisuuksia tuetaan Kopioi toiminnon lähde -osassa ORC-muotoa käytettäessä.
Name | Kuvaus | Arvo | Pakollinen | JSON-komentosarjaominaisuus |
---|---|---|---|---|
Tiedostomuoto | Käytettävä tiedostomuoto. | ÖRKKI | Kyllä | tyyppi (alle datasetSettings ):Örkki |
Pakkaustyyppi | ORC-tiedostojen lukemiseen käytettävä pakkauspakkauksenhallinta. | Ei ole zlib tyylikäs |
En | orcCompressionCodec: ei mitään zlib tyylikäs |
Seuraavat ominaisuudet ovat tuettuja kopiointiaktiviteetin kohde - osassa, kun käytät ORC-muotoa.
Name | Kuvaus | Arvo | Pakollinen | JSON-komentosarjaominaisuus |
---|---|---|---|---|
Tiedostomuoto | Käytettävä tiedostomuoto. | ÖRKKI | Kyllä | tyyppi (alle datasetSettings ):Örkki |
Pakkaustyyppi | ORC-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. | Ei ole zlib tyylikäs |
En | orcCompressionCodec: ei mitään zlib tyylikäs |
Rivien enimmäismäärä tiedostoa kohden | Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän. Määritä kaikki rivit, jotka haluat kirjoittaa tiedostoa kohden. | <rivien enimmäismäärä tiedostoa kohden> | En | maxRowsPerFile |
Tiedostonimen etuliite | Käytettävissä, kun tiedostoa kohden on määritetty enintään riviä. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli: <fileNamePrefix>_00000.<fileExtension> . Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö. |
<tiedostonimen etuliite> | En | fileNamePrefix |