Format XML di Data Factory di Microsoft Fabric
Artikel ini menguraikan cara mengonfigurasi format XML dalam alur data Data Factory di Microsoft Fabric.
Kemampuan yang didukung
Format XML didukung untuk aktivitas dan konektor berikut sebagai sumber.
Kategori | Konektor/Aktivitas |
---|---|
Konektor yang didukung | Amazon S3 |
Kompatibel dengan Amazon S3 | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Sistem file | |
FTP | |
Penyimpanan Cloud Google | |
HTTP | |
File Lakehouse | |
Penyimpanan Cloud Oracle | |
SFTP | |
Aktivitas yang didukung | Aktivitas penyalinan (sumber/-) |
Aktivitas pencarian | |
Aktivitas GetMetadata | |
Aktivitas penghapusan |
Format XML dalam aktivitas salin
Untuk mengonfigurasi format XML, pilih koneksi Anda di sumber aktivitas penyalinan alur data, lalu pilih XML di daftar drop-down Format file. Pilih Pengaturan untuk konfigurasi lebih lanjut dari format ini.
XML sebagai sumber
Setelah Anda memilih Pengaturan di bagian Format file, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.
Jenis kompresi: Codec kompresi yang digunakan untuk membaca file XML. Anda dapat memilih dari None, bzip2, gzip, deflate, ZipDeflate, TarGZip atau jenis tar dalam daftar drop-down.
Jika Anda memilih ZipDeflate sebagai jenis kompresi, Pertahankan nama file zip sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .
- Mempertahankan nama file zip sebagai folder: Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan.
- Jika kotak ini dicentang (default), layanan menulis file yang tidak di-zip ke
<specified file path>/<folder named as source zip file>/
. - Jika kotak ini tidak dicentang, layanan menulis file yang tidak di-zip langsung ke
<specified file path>
. Pastikan Anda tidak memiliki nama file duplikat dalam file zip sumber yang berbeda untuk menghindari persaingan atau perilaku tak terduga.
- Jika kotak ini dicentang (default), layanan menulis file yang tidak di-zip ke
Jika Anda memilih TarGZip/tar sebagai jenis kompresi, Pertahankan nama file kompresi sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .
- Mempertahankan nama file kompresi sebagai folder: Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan.
- Jika kotak ini dicentang (default), layanan menulis file yang didekompresi ke
<specified file path>/<folder named as source compressed file>/
. - Jika kotak ini tidak dicentang, layanan menulis file yang didekompresi langsung ke
<specified file path>
. Pastikan Anda tidak memiliki nama file duplikat di file sumber yang berbeda untuk menghindari persaingan atau perilaku yang tidak terduga.
- Jika kotak ini dicentang (default), layanan menulis file yang didekompresi ke
- Mempertahankan nama file zip sebagai folder: Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan.
Tingkat kompresi: Tentukan rasio pemadatan saat Anda memilih jenis kompresi. Anda dapat memilih dari Tercepat atau Optimal.
- Tercepat: Operasi kompresi akan selesai secepat mungkin, meski file hasil tidak dikompresi secara optimal.
- Optimal: Operasi pemadatan akan dipadatkan secara optimal, bahkan jika operasi membutuhkan waktu lebih lama untuk menyelesaikannya. Untuk informasi selengkapnya, lihat topik Tingkat Pemadatan.
Pengodean: Tentukan jenis pengodean yang digunakan untuk menulis file pengujian. Pilih satu jenis dari daftar drop-down. Nilai defaultnya adalah UTF-8.
Nilai null: Menentukan representasi string dari nilai null. Nilai defaultnya adalah untai kosong.
Di bawah Pengaturan tingkat lanjut di tab Sumber , properti terkait format XML berikut ini ditampilkan.
Mode validasi: Menentukan apakah akan memvalidasi skema XML. Pilih satu mode dari daftar drop-down.
- Tidak Ada: Pilih ini untuk tidak menggunakan mode validasi.
- xsd: Pilih ini untuk memvalidasi skema XML menggunakan XSD.
- dtd: Pilih ini untuk memvalidasi skema XML menggunakan DTD.
Namespace: Tentukan apakah akan mengaktifkan namespace saat mengurai file XML. Ini dipilih secara default.
Pasangan awalan namespace: Jika Namespace diaktifkan, pilih + Baru dan tentukan URL dan Awalan. Anda dapat menambahkan lebih banyak pasangan dengan memilih + Baru.
URI namespace layanan untuk pemetaan awalan digunakan untuk memberi nama bidang saat mengurai file XML. Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML. Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalahprefix:fieldName
.Mendeteksi jenis data: Tentukan apakah akan mendeteksi tipe data bilangan bulat, ganda, dan Boolean. Ini dipilih secara default.
Ringkasan tabel
XML sebagai sumber
Properti berikut ini didukung di bagian Sumber aktivitas salin saat menggunakan format XML.
Nama | Deskripsi | Nilai | Diperlukan | Properti skrip JSON |
---|---|---|---|---|
Format file | Format file yang ingin Anda gunakan. | XML | Ya | type (di bawah datasetSettings ):Xml |
Jenis pemadatan | Codec kompresi yang digunakan untuk membaca file XML. | Tidak bzip2 gzip Mengempis ZipDeflate TarGZip ter |
No | type (di bawah compression ): bzip2 gzip Mengempis ZipDeflate TarGZip tar |
Tingkat pemadatan | Rasio pemadatan. | Tercepat Optimal |
Tanpa | level (di bawah compression ): Tercepat Optimal |
Pengodean | Jenis pengodean yang digunakan untuk membaca file pengujian. | "UTF-8" (secara default),"UTF-8 tanpa BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860"M865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Tanpa | encodingName |
Pertahankan nama file zip sebagai folder | Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan. | Dipilih (default) atau batal pilih | No | preserveZipFileNameAsFolder (di bawah compressionProperties ->type sebagai ZipDeflateReadSettings ):true (default) atau false |
Pertahankan nama file kompresi sebagai folder | Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan. | Dipilih (default) atau batal pilih | No | preserveCompressionFileNameAsFolder (di bawah compressionProperties ->type sebagai TarGZipReadSettings atau TarReadSettings ):true (default) atau false |
Nilai null | Representasi string dari nilai null. | <nilai null Anda> string kosong (secara default) |
Tanpa | nullValue |
Mode validasi | Apakah akan memvalidasi skema XML. | Tidak xsd Dtd |
No | validationMode: xsd Dtd |
Namespace | Apakah akan mengaktifkan namespace layanan saat memilah file XML. | Dipilih (default) atau tidak dipilih | No | namespace layanan: true (default) atau false |
Pasangan awalan namespace | URI namespace ke pemetaan awalan, yang digunakan untuk memberi nama bidang saat mengurai file XML. Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML. Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalah prefix:fieldName . |
< url >:< awalan > | No | namespacePrefixes: < url >:< awalan > |
Mendeteksi jenis data | Apakah akan mendeteksi jenis data bilangan bulat, ganda, dan Boolean. | Dipilih (default) atau tidak dipilih | No | detectDataType: true (default) atau false |