XML-formátum a Data Factoryben a Microsoft Fabricben
Ez a cikk bemutatja, hogyan konfigurálhat XML-formátumot a Data Factory adatfolyamában a Microsoft Fabricben.
Az XML formátum a következő tevékenységekhez és összekötőkhöz támogatott forrásként.
Kategória | Összekötő/tevékenység |
---|---|
Támogatott összekötő | Amazon S3 |
Amazon S3 kompatibilis | |
Azure Blob Storage | |
1. generációs Azure Data Lake Storage | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Fájlrendszer | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Támogatott tevékenység | Copy tevékenység (forrás/-) |
Keresési tevékenység | |
GetMetadata-tevékenység | |
Tevékenység törlése |
Az XML-formátum konfigurálásához válassza ki a kapcsolatot az adatfolyam-másolási tevékenység forrásában, majd válassza ki az XML-t a Fájlformátum legördülő listában. A formátum további konfigurálásához válassza a Beállítások lehetőséget .
Miután kiválasztotta a Beállítások lehetőséget a Fájlformátum szakaszban, a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.
Tömörítés típusa: Az XML-fájlok olvasásához használt tömörítési kodek. A legördülő listában választhat a Nincs, a bzip2, a gzip, a deflát, a ZipDeflate, a TarGZip vagy a tar típus közül.
Ha tömörítési típusként a ZipDeflate lehetőséget választja, a Zip-fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.
- Zip-fájlnév megőrzése mappaként: Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappaszerkezetként.
- Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás kibontott fájlokat ír a fájlba
<specified file path>/<folder named as source zip file>/
. - Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás a kibontott fájlokat közvetlenül a fájlba
<specified file path>
írja. Győződjön meg arról, hogy nincsenek ismétlődő fájlnevek a különböző forrás zip-fájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.
- Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás kibontott fájlokat ír a fájlba
Ha a TarGZip/tar formátumot választja tömörítési típusként, a Tömörítési fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.
- A tömörítési fájl nevének megőrzése mappaként: Azt jelzi, hogy a forrásként tömörített fájlnevet mappaszerkezetként szeretné-e megőrizni a másolás során.
- Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás tömörített fájlokat ír a fájlba
<specified file path>/<folder named as source compressed file>/
. - Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás közvetlenül
<specified file path>
ide írja a tömörített fájlokat. Győződjön meg arról, hogy nem duplikált fájlnevek szerepelnek a különböző forrásfájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.
- Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás tömörített fájlokat ír a fájlba
- Zip-fájlnév megőrzése mappaként: Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappaszerkezetként.
Tömörítési szint: A tömörítési típus kiválasztásakor adja meg a tömörítési arányt. Választhat a Leggyorsabb vagy az Optimális lehetőség közül.
- Leggyorsabb: A tömörítési műveletnek a lehető leggyorsabban végre kell hajtania, még akkor is, ha az eredményül kapott fájl nincs optimálisan tömörítve.
- Optimális: A tömörítési műveletet optimálisan kell tömöríteni, még akkor is, ha a művelet végrehajtása hosszabb időt vesz igénybe. További információ: Tömörítési szint témakör.
Kódolás: Adja meg a tesztfájlok írásához használt kódolási típust. Válasszon egy típust a legördülő listából. Az alapértelmezett érték az UTF-8.
Null érték: A null érték sztring-ábrázolását adja meg. Az alapértelmezett érték üres sztring.
A Forrás lapon a Speciális beállítások területen a következő XML-formátumhoz kapcsolódó tulajdonságok jelennek meg.
Érvényesítési mód: Meghatározza, hogy érvényesítse-e az XML-sémát. Válasszon ki egy módot a legördülő listából.
- Nincs: Ezt a lehetőséget választva nem használhat érvényesítési módot.
- xsd: Ezt választva ellenőrizheti az XML-sémát az XSD használatával.
- dtd: Ezt választva érvényesítheti az XML-sémát a DTD használatával.
Névterek: Adja meg, hogy engedélyezi-e a névteret az XML-fájlok elemzésekor. Alapértelmezés szerint ki van jelölve.
Névtér előtagpárok: Ha a névterek engedélyezve van, válassza az + Új lehetőséget, és adja meg az URL-címet és az előtagot. További párok hozzáadásához válassza az + Új lehetőséget.
Az XML-fájl elemzésekor a névtér URI-jának használata az előtag-leképezéshez a mezők elnevezésére szolgál. Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel. Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve .prefix:fieldName
Adattípus észlelése: Megadhatja, hogy az egész, a dupla és a logikai adattípust észlelje-e. Alapértelmezés szerint ki van jelölve.
Xml-formátum használata esetén a másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak.
Név | Leírás | Érték | Szükséges | JSON-szkripttulajdonság |
---|---|---|---|---|
Fájlformátum | A használni kívánt fájlformátum. | XML | Igen | típus (alatt datasetSettings ):Xml |
Tömörítés típusa | Az XML-fájlok olvasásához használt tömörítési kodek. | Egyik sem bzip2 gzip csökkent ZipDeflate TarGZip kátrány |
Nem | típus (alatt compression ): bzip2 gzip csökkent ZipDeflate TarGZip kátrány |
Tömörítési szint | A tömörítési arány. | Leggyorsabb Optimális |
Nem | szint (alatt compression ): Leggyorsabb Optimális |
Kódolás | A tesztfájlok olvasásához használt kódolási típus. | "UTF-8" (alapértelmezés szerint),"UTF-8 BOM nélkül", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865"869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nem | encodingName |
Zip-fájlnév megőrzése mappaként | Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappastruktúraként. | Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése | Nem | preserveZipFileNameAsFolder (alatt compressionProperties ->type as ZipDeflateReadSettings ):igaz (alapértelmezett) vagy hamis |
Tömörítési fájlnév megőrzése mappaként | Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás tömörített fájlnevét mappaszerkezetként. | Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése | Nem | preserveCompressionFileNameAsFolder (alatt compressionProperties ->type mint vagy TarReadSettings TarGZipReadSettings ):igaz (alapértelmezett) vagy hamis |
Null érték | A null érték sztring-ábrázolása. | <a null érték> üres sztring (alapértelmezés szerint) |
Nem | nullValue |
Érvényesítési mód | Ellenőrizze az XML-sémát. | Egyik sem xsd Dtd |
Nem | validationMode: xsd Dtd |
Névterek | A névtér engedélyezése az XML-fájlok elemzésekor. | Ki van jelölve (alapértelmezett) vagy nincs kijelölve | Nem | névterek: igaz (alapértelmezett) vagy hamis |
Névtér előtagpárjai | Névtér URI az előtag-leképezéshez, amely az XML-fájl elemzésekor a mezők elnevezésére szolgál. Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel. Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve . prefix:fieldName |
< url >:< előtag > | Nem | namespacePrefixes: < url >:< előtag > |
Adattípus észlelése | Az egész szám, a dupla és a logikai adattípus észlelése. | Ki van jelölve (alapértelmezett) vagy nincs kijelölve | Nem | detectDataType: igaz (alapértelmezett) vagy hamis |