Microsoft Fabric'te Data Factory'de XML biçimi
Bu makalede, Microsoft Fabric'te Data Factory'nin veri işlem hattında XML biçimini yapılandırma adımları açıklanmaktadır.
XML biçimi, kaynak olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.
Kategori | Bağlayıcı/Etkinlik |
---|---|
Desteklenen bağlayıcı | Amazon S3 |
Amazon S3 Uyumlu | |
Azure Blob Depolama | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage 2. Nesil | |
Azure Dosyaları | |
Dosya sistemi | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Dosyaları | |
Oracle Cloud Storage | |
SFTP | |
Desteklenen etkinlik | Kopyalama etkinliği (kaynak/-) |
Arama etkinliği | |
GetMetadata etkinliği | |
Silme etkinliği |
XML biçimini yapılandırmak için veri işlem hattı kopyalama etkinliği kaynağında bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde XML'yi seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.
Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.
Sıkıştırma türü: XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Açılan listede None, bzip2, gzip, deflate, ZipDeflate, TarGZip veya tar type seçeneklerinden birini belirleyebilirsiniz.
Sıkıştırma türü olarak ZipDeflate'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Zip dosyası adını klasör olarak koru görüntülenir.
- Zip dosyası adını klasör olarak koru: Kaynak zip dosyası adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine
<specified file path>/<folder named as source zip file>/
yazar. - Bu kutunun işareti kaldırılırsa, hizmet sıkıştırması açılmış dosyaları doğrudan adresine
<specified file path>
yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine
Sıkıştırma türü olarak TarGZip/tar'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Sıkıştırma dosyası adını klasör olarak koru görüntülenir.
- Sıkıştırma dosyası adını klasör olarak koru: Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine
<specified file path>/<folder named as source compressed file>/
yazar. - Bu kutunun işareti kaldırılırsa, hizmet sıkıştırılan dosyaları doğrudan öğesine
<specified file path>
yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak dosyalarda yinelenen dosya adlarınız olmadığından emin olun.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine
- Zip dosyası adını klasör olarak koru: Kaynak zip dosyası adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En Hızlı veya En Uygun arasından seçim yapabilirsiniz.
- En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
- En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
Kodlama: Test dosyalarını yazmak için kullanılan kodlama türünü belirtin. Açılan listeden bir tür seçin. Varsayılan değer UTF-8'dir.
Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.
Kaynak sekmesindeki Gelişmiş ayarlar'ın altında, aşağıdaki XML biçimiyle ilgili özellikler görüntülenir.
Doğrulama modu: XML şemasının doğrulanıp doğrulanmayacağını belirtir. Açılan listeden bir mod seçin.
- Yok: Doğrulama modunu kullanmamak için bunu seçin.
- xsd: XSD kullanarak XML şemasını doğrulamak için bunu seçin.
- dtd: DTD kullanarak XML şemasını doğrulamak için bunu seçin.
Ad Alanları: XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan olarak seçilidir.
Ad alanı ön ek çiftleri: Ad Alanları etkinse + Yeni'yi seçip URL ve Ön Ek'i belirtin. + Yeni'yi seçerek daha fazla çift ekleyebilirsiniz.
Xml dosyası ayrıştırılırken alanları adlandırmak için ön ek eşlemeye yönelik ad alanı URI'si kullanılır. XML dosyasında ad alanı varsa ve ad alanı etkinse, alan adı varsayılan olarak XML belgesindekiyle aynıdır. Bu eşlemede ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı olurprefix:fieldName
.Veri türünü algılama: Tamsayı, çift ve Boole veri türlerinin algılanıp algılanmayacağını belirtin. Varsayılan olarak seçilidir.
XML biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.
Ad | Açıklama | Değer | Gerekli | JSON betik özelliği |
---|---|---|---|---|
Dosya biçimi | Kullanmak istediğiniz dosya biçimi. | XML | Yes | type (altında datasetSettings ):Xml |
Sıkıştırma türü | XML dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. | Hiçbiri bzip2 gzip Deflate ZipDeflate TarGZip tar |
Hayır | type (altında compression ): bzip2 gzip Deflate ZipDeflate TarGZip tar |
Sıkıştırma düzeyi | Sıkıştırma oranı. | Hızlı En iyi |
Hayır | level (altında compression ): Hızlı En iyi |
Kodlama | Test dosyalarını okumak için kullanılan kodlama türü. | "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Hayır | encodingName |
Zip dosyası adını klasör olarak koru | Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. | Seçili (varsayılan) veya seçimini kaldır | Hayır | preserveZipFileNameAsFolder (altında compressionProperties ->type olarak ZipDeflateReadSettings ):true (varsayılan) veya false |
Sıkıştırma dosyası adını klasör olarak koru | Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. | Seçili (varsayılan) veya seçimini kaldır | Hayır | preserveCompressionFileNameAsFolder (altında compressionProperties ->type veya TarGZipReadSettings TarReadSettings ):true (varsayılan) veya false |
Null değer | Null değerin dize gösterimi. | <null değeriniz> boş dize (varsayılan olarak) |
Hayır | nullValue |
Doğrulama modu | XML şemasının doğrulanıp doğrulanmayacağı. | Hiçbiri xsd Dtd |
Hayır | validationMode: xsd Dtd |
Ad Alanları | XML dosyalarını ayrıştırırken ad alanının etkinleştirilip etkinleştirilmeyileceği. | Seçili (varsayılan) veya seçilmemiş | Hayır | ad alanları: true (varsayılan) veya false |
Ad alanı ön ek çiftleri | XML dosyasını ayrıştırırken alanları adlandırmak için kullanılan ön ek eşlemesine ad alanı URI'si. XML dosyasında ad alanı varsa ve ad alanı etkinse, alan adı varsayılan olarak XML belgesindekiyle aynıdır. Bu eşlemede ad alanı URI'si için tanımlanmış bir öğe varsa, alan adı olur prefix:fieldName . |
< url >:< ön ek > | Hayır | namespacePrefixes: < url >:< ön ek > |
Veri türünü algılama | Tamsayı, çift ve Boole veri türlerinin algılanıp algılanması. | Seçili (varsayılan) veya seçilmemiş | Hayır | detectDataType: true (varsayılan) veya false |