Format ORC dalam Data Factory di Microsoft Fabric

Artikel ini menguraikan cara mengonfigurasi format ORC dalam alur data Data Factory di Microsoft Fabric.

Kemampuan yang didukung

Format ORC didukung untuk aktivitas dan konektor berikut sebagai sumber dan tujuan.

Category Koneksi/Aktivitas
Konektor yang didukung Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
FTP
Penyimpanan Cloud Google
HTTP
SFTP
Aktivitas yang didukung Aktivitas Salin
Aktivitas pencarian
Aktivitas GetMetadata
Menghapus aktivitas data

Format ORC dalam aktivitas salin

Untuk mengonfigurasi format ORC, pilih koneksi Anda di sumber atau tujuan aktivitas penyalinan alur data, lalu pilih ORC di daftar drop-down format File. Pilih Pengaturan untuk konfigurasi lebih lanjut dari format ini.

Screenshot showing file format settings.

Format ORC sebagai sumber

Setelah Anda memilih Pengaturan di bagian Format file, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.

Screenshot showing ORC file format source.

  • Jenis kompresi: Pilih codec kompresi yang digunakan untuk membaca file ORC di daftar drop-down. Anda dapat memilih dari None, zlib , atau snappy.

Format ORC sebagai tujuan

Setelah Anda memilih Pengaturan, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.

Screenshot showing ORC file format destination.

  • Jenis kompresi: Pilih codec kompresi yang digunakan untuk menulis file ORC di daftar drop-down. Anda dapat memilih dari None, zlib , atau snappy.

Di bawah Pengaturan tingkat lanjut di tab Tujuan , properti terkait format ORC berikut ditampilkan.

  • Baris maks per file: Saat menulis data ke dalam folder, Anda dapat memilih untuk menulis ke beberapa file dan menentukan baris maksimum per file. Tentukan baris maksimum yang ingin Anda tulis per file.
  • Awalan nama file: Berlaku saat Baris maks per file dikonfigurasi. Menentukan awalan nama file saat menulis data ke beberapa file, menghasilkan pola ini: <fileNamePrefix>_00000.<fileExtension>. Jika tidak ditentukan, awalan nama file dibuat secara otomatis. Properti ini tidak berlaku ketika sumbernya adalah penyimpanan berbasis file atau opsi partisi yang mengaktifkan penyimpanan data.

Ringkasan tabel

ORC sebagai sumber

Properti berikut ini didukung di bagian Sumber aktivitas salin saat menggunakan format ORC.

Nama Deskripsi Nilai Wajib Properti skrip JSON
Format file Format file yang ingin Anda gunakan. ORC Ya type (di bawah datasetSettings):
Orc
Jenis pemadatan Codec kompresi yang digunakan untuk membaca file ORC. Tidak
zlib
Tajam
No orcCompressionCodec:
tidak ada
zlib
snappy

ORC sebagai tujuan

Properti berikut ini didukung di bagian Tujuan aktivitas salin saat menggunakan format ORC.

Nama Deskripsi Nilai Wajib Properti skrip JSON
Format file Format file yang ingin Anda gunakan. ORC Ya type (di bawah datasetSettings):
Orc
Jenis pemadatan Codec kompresi yang digunakan untuk menulis file ORC. Tidak
zlib
Tajam
No orcCompressionCodec:
tidak ada
zlib
snappy
Baris maks per file Saat menulis data ke dalam folder, Anda dapat memilih untuk menulis ke beberapa file dan menentukan baris maksimum per file. Tentukan baris maksimum yang ingin Anda tulis per file. <baris maks Anda per file> No maxRowsPerFile
Awalan nama file Berlaku saat Baris maks per file dikonfigurasi. Menentukan awalan nama file saat menulis data ke beberapa file, menghasilkan pola ini: <fileNamePrefix>_00000.<fileExtension>. Jika tidak ditentukan, awalan nama file dibuat secara otomatis. Properti ini tidak berlaku ketika sumbernya adalah penyimpanan berbasis file atau opsi partisi yang mengaktifkan penyimpanan data. <awalan nama file Anda> No fileNamePrefix