Megosztás a következőn keresztül:


XML-formátum a Data Factoryben a Microsoft Fabricben

Ez a cikk bemutatja, hogyan konfigurálhat XML-formátumot a Data Factory adatfolyamában a Microsoft Fabricben.

Támogatott képességek

Az XML formátum a következő tevékenységekhez és összekötőkhöz támogatott forrásként.

Kategória Összekötő/tevékenység
Támogatott összekötő Amazon S3
Amazon S3 kompatibilis
Azure Blob Storage
1. generációs Azure Data Lake Storage
Azure Data Lake Storage Gen2
Azure Files
Fájlrendszer
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Oracle Cloud Storage
SFTP
Támogatott tevékenység Copy tevékenység (forrás/-)
Keresési tevékenység
GetMetadata-tevékenység
Tevékenység törlése

XML-formátum másolási tevékenységben

Az XML-formátum konfigurálásához válassza ki a kapcsolatot az adatfolyam-másolási tevékenység forrásában, majd válassza ki az XML-t a Fájlformátum legördülő listában. A formátum további konfigurálásához válassza a Beállítások lehetőséget .

Képernyőkép a fájlformátum beállításairól.

XML mint forrás

Miután kiválasztotta a Beállítások lehetőséget a Fájlformátum szakaszban, a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.

Képernyőkép a fájlformátum kiválasztásáról.

  • Tömörítés típusa: Az XML-fájlok olvasásához használt tömörítési kodek. A legördülő listában választhat a Nincs, a bzip2, a gzip, a deflát, a ZipDeflate, a TarGZip vagy a tar típus közül.

    Ha tömörítési típusként a ZipDeflate lehetőséget választja, a Zip-fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.

    • Zip-fájlnév megőrzése mappaként: Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappaszerkezetként.
      • Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás kibontott fájlokat ír a fájlba <specified file path>/<folder named as source zip file>/.
      • Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás a kibontott fájlokat közvetlenül a fájlba <specified file path>írja. Győződjön meg arról, hogy nincsenek ismétlődő fájlnevek a különböző forrás zip-fájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.

    Ha a TarGZip/tar formátumot választja tömörítési típusként, a Tömörítési fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.

    • A tömörítési fájl nevének megőrzése mappaként: Azt jelzi, hogy a forrásként tömörített fájlnevet mappaszerkezetként szeretné-e megőrizni a másolás során.
      • Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás tömörített fájlokat ír a fájlba <specified file path>/<folder named as source compressed file>/.
      • Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás közvetlenül <specified file path>ide írja a tömörített fájlokat. Győződjön meg arról, hogy nem duplikált fájlnevek szerepelnek a különböző forrásfájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.
  • Tömörítési szint: A tömörítési típus kiválasztásakor adja meg a tömörítési arányt. Választhat a Leggyorsabb vagy az Optimális lehetőség közül.

    • Leggyorsabb: A tömörítési műveletnek a lehető leggyorsabban végre kell hajtania, még akkor is, ha az eredményül kapott fájl nincs optimálisan tömörítve.
    • Optimális: A tömörítési műveletet optimálisan kell tömöríteni, még akkor is, ha a művelet végrehajtása hosszabb időt vesz igénybe. További információ: Tömörítési szint témakör.
  • Kódolás: Adja meg a tesztfájlok írásához használt kódolási típust. Válasszon egy típust a legördülő listából. Az alapértelmezett érték az UTF-8.

  • Null érték: A null érték sztring-ábrázolását adja meg. Az alapértelmezett érték üres sztring.

A Forrás lapon a Speciális beállítások területen a következő XML-formátumhoz kapcsolódó tulajdonságok jelennek meg.

  • Érvényesítési mód: Meghatározza, hogy érvényesítse-e az XML-sémát. Válasszon ki egy módot a legördülő listából.

    • Nincs: Ezt a lehetőséget választva nem használhat érvényesítési módot.
    • xsd: Ezt választva ellenőrizheti az XML-sémát az XSD használatával.
    • dtd: Ezt választva érvényesítheti az XML-sémát a DTD használatával.

    Képernyőkép az érvényesítési módokról.

  • Névterek: Adja meg, hogy engedélyezi-e a névteret az XML-fájlok elemzésekor. Alapértelmezés szerint ki van jelölve.

  • Névtér előtagpárok: Ha a névterek engedélyezve van, válassza az + Új lehetőséget, és adja meg az URL-címet és az előtagot. További párok hozzáadásához válassza az + Új lehetőséget.
    Az XML-fájl elemzésekor a névtér URI-jának használata az előtag-leképezéshez a mezők elnevezésére szolgál. Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel. Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve .prefix:fieldName

    Képernyőkép a névtér előtagpárjairól.

  • Adattípus észlelése: Megadhatja, hogy az egész, a dupla és a logikai adattípust észlelje-e. Alapértelmezés szerint ki van jelölve.

Táblázat összefoglalása

XML mint forrás

Xml-formátum használata esetén a másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak.

Név Leírás Érték Szükséges JSON-szkripttulajdonság
Fájlformátum A használni kívánt fájlformátum. XML Igen típus (alatt datasetSettings):
Xml
Tömörítés típusa Az XML-fájlok olvasásához használt tömörítési kodek. Egyik sem
bzip2
gzip
csökkent
ZipDeflate
TarGZip
kátrány
Nem típus (alatt compression):

bzip2
gzip
csökkent
ZipDeflate
TarGZip
kátrány
Tömörítési szint  A tömörítési arány. Leggyorsabb
Optimális 
Nem szint (alatt compression):
Leggyorsabb
Optimális
Kódolás A tesztfájlok olvasásához használt kódolási típus. "UTF-8" (alapértelmezés szerint),"UTF-8 BOM nélkül", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865"869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Nem encodingName
Zip-fájlnév megőrzése mappaként Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappastruktúraként. Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése Nem preserveZipFileNameAsFolder
(alatt compressionProperties->type as ZipDeflateReadSettings):
igaz (alapértelmezett) vagy hamis
Tömörítési fájlnév megőrzése mappaként Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás tömörített fájlnevét mappaszerkezetként. Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése Nem preserveCompressionFileNameAsFolder
(alatt compressionProperties->type mint vagy TarReadSettingsTarGZipReadSettings):
igaz (alapértelmezett) vagy hamis
Null érték A null érték sztring-ábrázolása. <a null érték>
üres sztring (alapértelmezés szerint)
Nem nullValue
Érvényesítési mód Ellenőrizze az XML-sémát. Egyik sem
xsd
Dtd
Nem validationMode:

xsd
Dtd
Névterek A névtér engedélyezése az XML-fájlok elemzésekor. Ki van jelölve (alapértelmezett) vagy nincs kijelölve Nem névterek:
igaz (alapértelmezett) vagy hamis
Névtér előtagpárjai Névtér URI az előtag-leképezéshez, amely az XML-fájl elemzésekor a mezők elnevezésére szolgál.
Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel.
Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve .prefix:fieldName
< url >:< előtag > Nem namespacePrefixes:
< url >:< előtag >
Adattípus észlelése Az egész szám, a dupla és a logikai adattípus észlelése. Ki van jelölve (alapértelmezett) vagy nincs kijelölve Nem detectDataType:
igaz (alapértelmezett) vagy hamis