Format ORC dalam Data Factory di Microsoft Fabric
Artikel ini menguraikan cara mengonfigurasi format ORC dalam alur data Data Factory di Microsoft Fabric.
Kemampuan yang didukung
Format ORC didukung untuk aktivitas dan konektor berikut sebagai sumber dan tujuan.
Kategori | Konektor/Aktivitas |
---|---|
Konektor yang didukung | Amazon S3 |
Kompatibel dengan Amazon S3 | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Sistem file | |
FTP | |
Penyimpanan Cloud Google | |
HTTP | |
File Lakehouse | |
Penyimpanan Cloud Oracle | |
SFTP | |
Aktivitas yang didukung | Aktivitas salin (sumber/tujuan) |
Aktivitas pencarian | |
Aktivitas GetMetadata | |
Menghapus aktivitas data |
Format ORC dalam aktivitas salin
Untuk mengonfigurasi format ORC, pilih koneksi Anda di sumber atau tujuan aktivitas penyalinan alur data, lalu pilih ORC di daftar drop-down format File. Pilih Pengaturan untuk konfigurasi lebih lanjut dari format ini.
Format ORC sebagai sumber
Setelah Anda memilih Pengaturan di bagian Format file, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.
- Jenis kompresi: Pilih codec kompresi yang digunakan untuk membaca file ORC di daftar drop-down. Anda dapat memilih dari None, zlib , atau snappy.
Format ORC sebagai tujuan
Setelah Anda memilih Pengaturan, properti berikut diperlihatkan dalam kotak dialog pengaturan format file pop-up.
- Jenis kompresi: Pilih codec kompresi yang digunakan untuk menulis file ORC di daftar drop-down. Anda dapat memilih dari None, zlib , atau snappy.
Di bawah Pengaturan tingkat lanjut di tab Tujuan , properti terkait format ORC berikut ditampilkan.
- Baris maks per file: Saat menulis data ke dalam folder, Anda dapat memilih untuk menulis ke beberapa file dan menentukan baris maksimum per file. Tentukan baris maksimum yang ingin Anda tulis per file.
- Awalan nama file: Berlaku saat Baris maks per file dikonfigurasi. Menentukan awalan nama file saat menulis data ke beberapa file, menghasilkan pola ini:
<fileNamePrefix>_00000.<fileExtension>
. Jika tidak ditentukan, awalan nama file dibuat secara otomatis. Properti ini tidak berlaku ketika sumbernya adalah penyimpanan berbasis file atau opsi partisi yang mengaktifkan penyimpanan data.
Ringkasan tabel
ORC sebagai sumber
Properti berikut ini didukung di bagian Sumber aktivitas salin saat menggunakan format ORC.
Nama | Deskripsi | Nilai | Wajib | Properti skrip JSON |
---|---|---|---|---|
Format file | Format file yang ingin Anda gunakan. | ORC | Ya | type (di bawah datasetSettings ):Orc |
Jenis pemadatan | Codec kompresi yang digunakan untuk membaca file ORC. | Tidak zlib Tajam |
No | orcCompressionCodec: tidak ada zlib snappy |
ORC sebagai tujuan
Properti berikut ini didukung di bagian Tujuan aktivitas salin saat menggunakan format ORC.
Nama | Deskripsi | Nilai | Wajib | Properti skrip JSON |
---|---|---|---|---|
Format file | Format file yang ingin Anda gunakan. | ORC | Ya | type (di bawah datasetSettings ):Orc |
Jenis pemadatan | Codec kompresi yang digunakan untuk menulis file ORC. | Tidak zlib Tajam |
No | orcCompressionCodec: tidak ada zlib snappy |
Baris maks per file | Saat menulis data ke dalam folder, Anda dapat memilih untuk menulis ke beberapa file dan menentukan baris maksimum per file. Tentukan baris maksimum yang ingin Anda tulis per file. | <baris maks Anda per file> | No | maxRowsPerFile |
Awalan nama file | Berlaku saat Baris maks per file dikonfigurasi. Menentukan awalan nama file saat menulis data ke beberapa file, menghasilkan pola ini: <fileNamePrefix>_00000.<fileExtension> . Jika tidak ditentukan, awalan nama file dibuat secara otomatis. Properti ini tidak berlaku ketika sumbernya adalah penyimpanan berbasis file atau opsi partisi yang mengaktifkan penyimpanan data. |
<awalan nama file Anda> | No | fileNamePrefix |