Aracılığıyla paylaş


Microsoft Fabric'te Data Factory'de XML biçimi

Bu makalede, Microsoft Fabric'te Data Factory'nin veri işlem hattında XML biçimini yapılandırma adımları açıklanmaktadır.

Desteklenen özellikler

XML biçimi, kaynak olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.

Kategori Bağlayıcı/Etkinlik
Desteklenen bağlayıcı Amazon S3
Amazon S3 Uyumlu
Azure Blob Depolama
Azure Data Lake Storage Gen1
Azure Data Lake Storage 2. Nesil
Azure Dosyaları
Dosya sistemi
FTP
Google Cloud Storage
HTTP
Lakehouse Dosyaları
Oracle Cloud Storage
SFTP
Desteklenen etkinlik Kopyalama etkinliği (kaynak/-)
Arama etkinliği
GetMetadata etkinliği
Silme etkinliği

Kopyalama etkinliğinde XML biçimi

XML biçimini yapılandırmak için veri işlem hattı kopyalama etkinliği kaynağında bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde XML'yi seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.

Dosya biçimi ayarlarını gösteren ekran görüntüsü.

Kaynak olarak XML

Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

Dosya biçimini seçmeyi gösteren ekran görüntüsü.

  • Sıkıştırma türü: XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Açılan listede None, bzip2, gzip, deflate, ZipDeflate, TarGZip veya tar type seçeneklerinden birini belirleyebilirsiniz.

    Sıkıştırma türü olarak ZipDeflate'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Zip dosyası adını klasör olarak koru görüntülenir.

    • Zip dosyası adını klasör olarak koru: Kaynak zip dosyası adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
      • Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine <specified file path>/<folder named as source zip file>/yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırması açılmış dosyaları doğrudan adresine <specified file path>yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.

    Sıkıştırma türü olarak TarGZip/tar'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Sıkıştırma dosyası adını klasör olarak koru görüntülenir.

    • Sıkıştırma dosyası adını klasör olarak koru: Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
      • Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine <specified file path>/<folder named as source compressed file>/yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırılan dosyaları doğrudan öğesine <specified file path>yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak dosyalarda yinelenen dosya adlarınız olmadığından emin olun.
  • Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En Hızlı veya En Uygun arasından seçim yapabilirsiniz.

    • En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
    • En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
  • Kodlama: Test dosyalarını yazmak için kullanılan kodlama türünü belirtin. Açılan listeden bir tür seçin. Varsayılan değer UTF-8'dir.

  • Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.

Kaynak sekmesindeki Gelişmiş ayarlar'ın altında, aşağıdaki XML biçimiyle ilgili özellikler görüntülenir.

  • Doğrulama modu: XML şemasının doğrulanıp doğrulanmayacağını belirtir. Açılan listeden bir mod seçin.

    • Yok: Doğrulama modunu kullanmamak için bunu seçin.
    • xsd: XSD kullanarak XML şemasını doğrulamak için bunu seçin.
    • dtd: DTD kullanarak XML şemasını doğrulamak için bunu seçin.

    Doğrulama modlarını gösteren ekran görüntüsü.

  • Ad Alanları: XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan olarak seçilidir.

  • Ad alanı ön ek çiftleri: Ad Alanları etkinse + Yeni'yi seçip URL ve Ön Ek'i belirtin. + Yeni'yi seçerek daha fazla çift ekleyebilirsiniz.
    Xml dosyası ayrıştırılırken alanları adlandırmak için ön ek eşlemeye yönelik ad alanı URI'si kullanılır. XML dosyasında ad alanı varsa ve ad alanı etkinse, alan adı varsayılan olarak XML belgesindekiyle aynıdır. Bu eşlemede ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı olur prefix:fieldName.

    Ad alanı ön ek çiftlerini gösteren ekran görüntüsü.

  • Veri türünü algılama: Tamsayı, çift ve Boole veri türlerinin algılanıp algılanmayacağını belirtin. Varsayılan olarak seçilidir.

Tablo özeti

Kaynak olarak XML

XML biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.

Ad Tarif Değer Gerekli JSON betik özelliği
Dosya biçimi Kullanmak istediğiniz dosya biçimi. XML Yes type (altında datasetSettings):
Xml
Sıkıştırma türü XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Hiçbiri
bzip2
gzip
Deflate
ZipDeflate
TarGZip
tar
Hayır type (altında compression):

bzip2
gzip
Deflate
ZipDeflate
TarGZip
tar
Sıkıştırma düzeyi  Sıkıştırma oranı. Hızlı
En iyi 
Hayır level (altında compression):
Hızlı
En iyi
Kodlama Test dosyalarını okumak için kullanılan kodlama türü. "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Hayır encodingName
Zip dosyası adını klasör olarak koru Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. Seçili (varsayılan) veya seçimini kaldır Hayır preserveZipFileNameAsFolder
(altında compressionProperties->type olarak ZipDeflateReadSettings):
true (varsayılan) veya false
Sıkıştırma dosyası adını klasör olarak koru Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. Seçili (varsayılan) veya seçimini kaldır Hayır preserveCompressionFileNameAsFolder
(altında compressionProperties->type veya TarGZipReadSettings TarReadSettings):
true (varsayılan) veya false
Null değer Null değerin dize gösterimi. <null değeriniz>
boş dize (varsayılan olarak)
Hayır nullValue
Doğrulama modu XML şemasının doğrulanıp doğrulanmayacağı. Hiçbiri
xsd
Dtd
Hayır validationMode:

xsd
Dtd
Ad Alanları XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyileceği. Seçili (varsayılan) veya seçilmemiş Hayır ad alanları:
true (varsayılan) veya false
Ad alanı ön ek çiftleri XML dosyasını ayrıştırırken alanları adlandırmak için kullanılan ön ek eşlemesine ad alanı URI'si.
XML dosyasında ad alanı varsa ve ad alanı etkinse, alan adı varsayılan olarak XML belgesindekiyle aynıdır.
Bu eşlemede ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı olur prefix:fieldName.
< url >:< ön ek > Hayır namespacePrefixes:
< url >:< ön ek >
Veri türünü algılama Tamsayı, çift ve Boole veri türlerinin algılanıp algılanması. Seçili (varsayılan) veya seçilmemiş Hayır detectDataType:
true (varsayılan) veya false