Microsoft Fabric içindeki Data Factory'de XML biçimi

XML (Genişletilebilir Biçimlendirme Dili), yapılandırılmış veri değişimi için metin tabanlı bir biçimdir. Bu makalede, Microsoft Fabric'de Data Factory'deki bir kopyalama etkinliği işlem hattında kaynak olarak XML biçiminin nasıl yapılandırılacağı açıklanmaktadır.

Desteklenen özellikler

XML biçimi, kaynak olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.

Kategori Bağlayıcı/Etkinlik
Desteklenen bağlayıcı Amazon S3
Amazon S3 Uyumlu
Azure Blob Depolama
, Azure Data Lake Storage V2
Azure Dosyaları
Dosya sistemi
FTP
Google Cloud Storage
HTTP
Lakehouse Dosyaları
Oracle Cloud Storage
SFTP
Desteklenen etkinlik Kopyalama etkinliği (kaynak/-)
Arama etkinliği
GetMetadata etkinliği
Etkinliği sil

Kopyalama etkinliğinde XML biçimi

XML biçimini yapılandırmak için, işlem hattı kopyalama etkinliğinin kaynağında bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde XML'yi seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.

Dosya biçimi ayarlarını gösteren ekran görüntüsü.

Kaynak olarak XML

Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

Dosya biçimini seçmeyi gösteren ekran görüntüsü.

  • Sıkıştırma türü: XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Açılan listede None, bzip2, gzip, deflate, ZipDeflate, TarGZip veya tar type seçeneklerinden birini belirleyebilirsiniz.

    Sıkıştırma türü olarak ZipDeflate'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Zip dosyası adını klasör olarak koru görüntülenir.

    • Zip dosyası adını klasör olarak koru: Kaynak zip dosyası adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
      • Bu kutu seçiliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları <specified file path>/<folder named as source zip file>/ konumuna yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırması açılmış dosyaları doğrudan <specified file path> adresine yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.

    Sıkıştırma türü olarak TarGZip/tar'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Sıkıştırma dosyası adını klasör olarak koru görüntülenir.

    • Sıkıştırma dosyası adını klasör olarak koru: Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
      • Eğer bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmamış dosyaları <specified file path>/<folder named as source compressed file>/ öğesine yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırılmamış dosyaları doğrudan <specified file path> öğesine yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak dosyalarda yinelenen dosya adlarınız olmadığından emin olun.
  • Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En Hızlı veya En Uygun arasından seçim yapabilirsiniz.

    • En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
    • En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
  • Kodlama: Metin dosyalarını okumak için kullanılan kodlama türünü belirtin. Açılan listeden bir tür seçin. Varsayılan değer UTF-8'dir.

  • Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.

Kaynak sekmesindeki Gelişmiş ayarlar'ın altında, aşağıdaki XML biçimiyle ilgili özellikler görüntülenir.

  • Doğrulama modu: XML şemasının doğrulanıp doğrulanmayacağını belirtir. Açılan listeden bir mod seçin.

    • Yok: Doğrulama modunu kullanmamak için bunu seçin.
    • xsd: XSD kullanarak XML şemasını doğrulamak için bunu seçin.
    • dtd: DTD kullanarak XML şemasını doğrulamak için bunu seçin.

    Doğrulama modlarını gösteren ekran görüntüsü.

  • Ad Alanları: XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan olarak seçilidir.

  • Ad alanı ön ek çiftleri: Ad Alanları etkinse + Yeni'yi seçip URL ve Ön Ek'i belirtin. + Yeni'yi seçerek daha fazla çift ekleyebilirsiniz.
    Xml dosyası ayrıştırılırken alanları adlandırmak için ön ek eşlemeye yönelik ad alanı URI'si kullanılır. XML dosyasında bir ad alanı varsa ve bu ad alanı etkinleştirilmişse, varsayılan olarak alan adı, XML belgesindekiyle aynıdır. Bu haritada, ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı prefix:fieldName olur.

    Ad alanı ön ek çiftlerini gösteren ekran görüntüsü.

  • Veri türünü algılama: Tamsayı, çift ve Boole veri türlerinin algılanıp algılanmayacağını belirtin. Varsayılan olarak seçilidir.

XML kopyalama aktivitesi özellikleri

Kaynak olarak XML

XML biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.

Ad Açıklama Değer Gerekli JSON betik özelliği
Dosya biçimi Kullanmak istediğiniz dosya biçimi. XML Yes type (altında datasetSettings):
Xml
Sıkıştırma türü XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Hiçbiri
bzip2
gzip
Deflate
ZipDeflate
TarGZip
tar
Hayır type (altında compression):

bzip2
gzip
deflate algoritması
ZipDeflate
TarGZip
tar
Sıkıştırma düzeyi  Sıkıştırma oranı. En Hızlı
En iyi 
Hayır level (altında compression):
En hızlı
En iyi
Kodlama Metin dosyalarını okumak için kullanılan kodlama türü. "UTF-8" (varsayılan olarak), "UTF-8 BOM olmadan", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Hayır kodlamaAdı
Zip dosyası adını klasör olarak koru Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. Seçili (varsayılan) veya seçimi kaldır Hayır Klasör Olarak Zip Dosya Adını Koru
(altında compressionProperties->type olarak ZipDeflateReadSettings):
true (varsayılan) veya false
Sıkıştırma dosyası adını klasör olarak koru Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. Seçili (varsayılan) veya seçimi kaldır Hayır preserveCompressionFileNameAsFolder
(altında compressionProperties->type veya TarGZipReadSettingsTarReadSettings):
true (varsayılan) veya false
Null değer Null değerin dize gösterimi. <null değeriniz>
boş dize (varsayılan olarak)
Hayır null değer
Doğrulama modu XML şemasının doğrulanıp doğrulanmayacağı. Hiçbiri
xsd
Dtd
Hayır DoğrulamaModu

xsd
Dtd
Ad Alanları XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyileceği. Seçili (varsayılan) veya seçilmemiş Hayır ad alanları:
true (varsayılan) veya false
İsim alanı ön ek çiftleri Ad alanı URI'sinin önekle eşlemesi, XML dosyasını ayrıştırırken alanları adlandırmak için kullanılır.
XML dosyasında bir ad alanı varsa ve bu ad alanı etkinleştirilmişse, varsayılan olarak alan adı, XML belgesindekiyle aynıdır.
Bu haritada, ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı prefix:fieldName olur.
< url >:< ön ek > Hayır namespacePrefixes:
< url >:< ön ek >
Veri türünü algılama Tamsayı, çift ve Boole veri türlerinin algılanıp algılanması. Seçili (varsayılan) veya seçilmemiş Hayır veriTürünüTespitEt:
true (varsayılan) veya false