Format XML di Data Factory di Microsoft Fabric

Artikel ini menguraikan cara mengonfigurasi format XML dalam alur data Data Factory di Microsoft Fabric.

Kemampuan yang didukung

Format XML didukung untuk aktivitas dan konektor berikut sebagai sumber.

Category Koneksi/Aktivitas
Konektor yang didukung Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
FTP
Penyimpanan Cloud Google
HTTP
SFTP
Aktivitas yang didukung Aktivitas Salin
Aktivitas pencarian
Aktivitas GetMetadata
Aktivitas penghapusan

Format XML dalam aktivitas salin

Untuk mengonfigurasi format XML, pilih koneksi Anda di sumber aktivitas penyalinan alur data, lalu pilih XML di daftar drop-down Format file. Pilih Pengaturan untuk konfigurasi lebih lanjut dari format ini.

Screenshot showing file format settings.

XML sebagai sumber

Setelah Anda memilih Pengaturan di bagian Format file, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.

Screenshot showing selecting file format.

  • Jenis kompresi: Codec kompresi yang digunakan untuk membaca file XML. Anda dapat memilih dari None, bzip2, gzip, deflate, ZipDeflate, TarGZip atau jenis tar dalam daftar drop-down.

    Jika Anda memilih ZipDeflate sebagai jenis kompresi, Pertahankan nama file zip sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .

    • Mempertahankan nama file zip sebagai folder: Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan.
      • Jika kotak ini dicentang (default), layanan menulis file yang tidak di-zip ke <specified file path>/<folder named as source zip file>/.
      • Jika kotak ini tidak dicentang, layanan menulis file yang tidak di-zip langsung ke <specified file path>. Pastikan Anda tidak memiliki nama file duplikat dalam file zip sumber yang berbeda untuk menghindari persaingan atau perilaku tak terduga.

    Jika Anda memilih TarGZip/tar sebagai jenis kompresi, Pertahankan nama file kompresi sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .

    • Mempertahankan nama file kompresi sebagai folder: Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan.
      • Jika kotak ini dicentang (default), layanan menulis file yang didekompresi ke <specified file path>/<folder named as source compressed file>/.
      • Jika kotak ini tidak dicentang, layanan menulis file yang didekompresi langsung ke <specified file path>. Pastikan Anda tidak memiliki nama file duplikat di file sumber yang berbeda untuk menghindari persaingan atau perilaku yang tidak terduga.
  • Tingkat kompresi: Tentukan rasio pemadatan saat Anda memilih jenis kompresi. Anda dapat memilih dari Tercepat atau Optimal.

    • Tercepat: Operasi kompresi akan selesai secepat mungkin, meski file hasil tidak dikompresi secara optimal.
    • Optimal: Operasi pemadatan akan dipadatkan secara optimal, bahkan jika operasi membutuhkan waktu lebih lama untuk menyelesaikannya. Untuk informasi selengkapnya, lihat topik Tingkat Pemadatan.
  • Pengodean: Tentukan jenis pengodean yang digunakan untuk menulis file pengujian. Pilih satu jenis dari daftar drop-down. Nilai defaultnya adalah UTF-8.

  • Nilai null: Menentukan representasi string dari nilai null. Nilai defaultnya adalah untai kosong.

Di bawah Pengaturan tingkat lanjut di tab Sumber , properti terkait format XML berikut ini ditampilkan.

  • Mode validasi: Menentukan apakah akan memvalidasi skema XML. Pilih satu mode dari daftar drop-down.

    • Tidak Ada: Pilih ini untuk tidak menggunakan mode validasi.
    • xsd: Pilih ini untuk memvalidasi skema XML menggunakan XSD.
    • dtd: Pilih ini untuk memvalidasi skema XML menggunakan DTD.

    Screenshot showing validation modes.

  • Namespace: Tentukan apakah akan mengaktifkan namespace saat mengurai file XML. Ini dipilih secara default.

  • Pasangan awalan namespace: Jika Namespace diaktifkan, pilih + Baru dan tentukan URL dan Awalan. Anda dapat menambahkan lebih banyak pasangan dengan memilih + Baru.
    URI namespace layanan untuk pemetaan awalan digunakan untuk memberi nama bidang saat mengurai file XML. Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML. Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalah prefix:fieldName.

    Screenshot showing namespace prefix pairs.

  • Mendeteksi jenis data: Tentukan apakah akan mendeteksi tipe data bilangan bulat, ganda, dan Boolean. Ini dipilih secara default.

Ringkasan tabel

XML sebagai sumber

Properti berikut ini didukung di bagian Sumber aktivitas salin saat menggunakan format XML.

Nama Deskripsi Value Diperlukan Properti skrip JSON
Format file Format file yang ingin Anda gunakan. XML Ya type (di bawah datasetSettings):
Xml
Jenis pemadatan Codec kompresi yang digunakan untuk membaca file XML. Tidak
bzip2
gzip
Mengempis
ZipDeflate
TarGZip
Tar
No type (di bawah compression):

bzip2
gzip
Mengempis
ZipDeflate
TarGZip
tar
Tingkat pemadatan  Rasio pemadatan. Tercepat
Optimal 
Tanpa level (di bawah compression):
Tercepat
Optimal
Pengodean Jenis pengodean yang digunakan untuk membaca file pengujian. "UTF-8" (secara default),"UTF-8 tanpa BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860"M865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Tanpa encodingName
Pertahankan nama file zip sebagai folder Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan. Dipilih (default) atau batal pilih No preserveZipFileNameAsFolder
(di bawah compressionProperties->type sebagai ZipDeflateReadSettings):
true (default) atau false
Pertahankan nama file kompresi sebagai folder Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan. Dipilih (default) atau batal pilih No preserveCompressionFileNameAsFolder
(di bawah compressionProperties->type sebagai TarGZipReadSettings atau TarReadSettings):
true (default) atau false
Nilai null Representasi string dari nilai null. <nilai null Anda>
string kosong (secara default)
Tanpa nullValue
Mode validasi Apakah akan memvalidasi skema XML. Tidak
xsd
Dtd
No validationMode:

xsd
Dtd
Namespaces Apakah akan mengaktifkan namespace layanan saat memilah file XML. Dipilih (default) atau tidak dipilih No Namespaces:
true (default) atau false
Pasangan awalan namespace URI namespace ke pemetaan awalan, yang digunakan untuk memberi nama bidang saat mengurai file XML.
Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML.
Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalah prefix:fieldName.
< url >:< awalan > No namespacePrefixes:
< url >:< awalan >
Mendeteksi jenis data Apakah akan mendeteksi jenis data bilangan bulat, ganda, dan Boolean. Dipilih (default) atau tidak dipilih No detectDataType:
true (default) atau false