Bagikan melalui


Format XML di Data Factory di Microsoft Fabric

Artikel ini menguraikan cara mengonfigurasi format XML dalam alur data Data Factory di Microsoft Fabric.

Kemampuan yang didukung

Format XML didukung untuk aktivitas dan konektor berikut sebagai sumber.

Kategori Konektor/Aktivitas
Konektor yang didukung Amazon S3
Kompatibel dengan Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Sistem file
FTP
Penyimpanan Cloud Google
HTTP
File Lakehouse
Penyimpanan Cloud Oracle
SFTP
Aktivitas yang didukung Aktivitas penyalinan (sumber/-)
Aktivitas pencarian
Aktivitas GetMetadata
Aktivitas penghapusan

Format XML dalam aktivitas salin

Untuk mengonfigurasi format XML, pilih koneksi Anda di sumber aktivitas penyalinan alur data, lalu pilih XML di daftar drop-down Format file. Pilih Pengaturan untuk konfigurasi lebih lanjut dari format ini.

Cuplikan layar memperlihatkan pengaturan format file.

XML sebagai sumber

Setelah Anda memilih Pengaturan di bagian Format file, properti berikut ini diperlihatkan dalam kotak dialog pengaturan format file pop-up.

Cuplikan layar memperlihatkan pemilihan format file.

  • Jenis kompresi: Codec kompresi yang digunakan untuk membaca file XML. Anda dapat memilih dari None, bzip2, gzip, deflate, ZipDeflate, TarGZip atau jenis tar dalam daftar drop-down.

    Jika Anda memilih ZipDeflate sebagai jenis kompresi, Pertahankan nama file zip sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .

    • Mempertahankan nama file zip sebagai folder: Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan.
      • Jika kotak ini dicentang (default), layanan menulis file yang tidak di-zip ke <specified file path>/<folder named as source zip file>/.
      • Jika kotak ini tidak dicentang, layanan menulis file yang tidak di-zip langsung ke <specified file path>. Pastikan Anda tidak memiliki nama file duplikat dalam file zip sumber yang berbeda untuk menghindari persaingan atau perilaku tak terduga.

    Jika Anda memilih TarGZip/tar sebagai jenis kompresi, Pertahankan nama file kompresi sebagai folder ditampilkan di bawah pengaturan Tingkat Lanjut di tab Sumber .

    • Mempertahankan nama file kompresi sebagai folder: Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan.
      • Jika kotak ini dicentang (default), layanan menulis file yang didekompresi ke <specified file path>/<folder named as source compressed file>/.
      • Jika kotak ini tidak dicentang, layanan menulis file yang didekompresi langsung ke <specified file path>. Pastikan Anda tidak memiliki nama file duplikat di file sumber yang berbeda untuk menghindari persaingan atau perilaku yang tidak terduga.
  • Tingkat kompresi: Tentukan rasio pemadatan saat Anda memilih jenis kompresi. Anda dapat memilih dari Tercepat atau Optimal.

    • Tercepat: Operasi kompresi akan selesai secepat mungkin, meski file hasil tidak dikompresi secara optimal.
    • Optimal: Operasi pemadatan akan dipadatkan secara optimal, bahkan jika operasi membutuhkan waktu lebih lama untuk menyelesaikannya. Untuk informasi selengkapnya, lihat topik Tingkat Pemadatan.
  • Pengodean: Tentukan jenis pengodean yang digunakan untuk menulis file pengujian. Pilih satu jenis dari daftar drop-down. Nilai defaultnya adalah UTF-8.

  • Nilai null: Menentukan representasi string dari nilai null. Nilai defaultnya adalah untai kosong.

Di bawah Pengaturan tingkat lanjut di tab Sumber , properti terkait format XML berikut ini ditampilkan.

  • Mode validasi: Menentukan apakah akan memvalidasi skema XML. Pilih satu mode dari daftar drop-down.

    • Tidak Ada: Pilih ini untuk tidak menggunakan mode validasi.
    • xsd: Pilih ini untuk memvalidasi skema XML menggunakan XSD.
    • dtd: Pilih ini untuk memvalidasi skema XML menggunakan DTD.

    Cuplikan layar memperlihatkan mode validasi.

  • Namespace: Tentukan apakah akan mengaktifkan namespace saat mengurai file XML. Ini dipilih secara default.

  • Pasangan awalan namespace: Jika Namespace diaktifkan, pilih + Baru dan tentukan URL dan Awalan. Anda dapat menambahkan lebih banyak pasangan dengan memilih + Baru.
    URI namespace layanan untuk pemetaan awalan digunakan untuk memberi nama bidang saat mengurai file XML. Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML. Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalah prefix:fieldName.

    Cuplikan layar memperlihatkan pasangan awalan namespace.

  • Mendeteksi jenis data: Tentukan apakah akan mendeteksi tipe data bilangan bulat, ganda, dan Boolean. Ini dipilih secara default.

Ringkasan tabel

XML sebagai sumber

Properti berikut ini didukung di bagian Sumber aktivitas salin saat menggunakan format XML.

Nama Deskripsi Nilai Diperlukan Properti skrip JSON
Format file Format file yang ingin Anda gunakan. XML Ya type (di bawah datasetSettings):
Xml
Jenis pemadatan Codec kompresi yang digunakan untuk membaca file XML. Tidak
bzip2
gzip
Mengempis
ZipDeflate
TarGZip
ter
No type (di bawah compression):

bzip2
gzip
Mengempis
ZipDeflate
TarGZip
tar
Tingkat pemadatan  Rasio pemadatan. Tercepat
Optimal 
Tanpa level (di bawah compression):
Tercepat
Optimal
Pengodean Jenis pengodean yang digunakan untuk membaca file pengujian. "UTF-8" (secara default),"UTF-8 tanpa BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860", "IBM861", "IBM863", "IBM864", "IBM860"M865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Tanpa encodingName
Pertahankan nama file zip sebagai folder Menunjukkan apakah akan mempertahankan nama file zip sumber sebagai struktur folder selama penyalinan. Dipilih (default) atau batal pilih No preserveZipFileNameAsFolder
(di bawah compressionProperties->type sebagai ZipDeflateReadSettings):
true (default) atau false
Pertahankan nama file kompresi sebagai folder Menunjukkan apakah akan mempertahankan nama file terkompresi sumber sebagai struktur folder selama penyalinan. Dipilih (default) atau batal pilih No preserveCompressionFileNameAsFolder
(di bawah compressionProperties->type sebagai TarGZipReadSettings atau TarReadSettings):
true (default) atau false
Nilai null Representasi string dari nilai null. <nilai null Anda>
string kosong (secara default)
Tanpa nullValue
Mode validasi Apakah akan memvalidasi skema XML. Tidak
xsd
Dtd
No validationMode:

xsd
Dtd
Namespace Apakah akan mengaktifkan namespace layanan saat memilah file XML. Dipilih (default) atau tidak dipilih No namespace layanan:
true (default) atau false
Pasangan awalan namespace URI namespace ke pemetaan awalan, yang digunakan untuk memberi nama bidang saat mengurai file XML.
Jika file XML memiliki namespace layanan dan namespace diaktifkan, secara default, nama bidang akan sama seperti yang ada di dokumen XML.
Jika ada item yang ditetapkan untuk URI namespace layanan di pemetaan ini, nama bidangnya adalah prefix:fieldName.
< url >:< awalan > No namespacePrefixes:
< url >:< awalan >
Mendeteksi jenis data Apakah akan mendeteksi jenis data bilangan bulat, ganda, dan Boolean. Dipilih (default) atau tidak dipilih No detectDataType:
true (default) atau false