Olvasás angol nyelven

Megosztás a következőn keresztül:


XML-formátum a Data Factoryben a Microsoft Fabricben

Ez a cikk bemutatja, hogyan konfigurálhat XML-formátumot a Data Factory adatfolyamában a Microsoft Fabricben.

Támogatott képességek

Az XML formátum a következő tevékenységekhez és összekötőkhöz támogatott forrásként.

XML-formátum másolási tevékenységben

Az XML-formátum konfigurálásához válassza ki a kapcsolatot az adatfolyam-másolási tevékenység forrásában, majd válassza ki az XML-t a Fájlformátum legördülő listában. A formátum további konfigurálásához válassza a Beállítások lehetőséget .

Képernyőkép a fájlformátum beállításairól.

XML mint forrás

Miután kiválasztotta a Beállítások lehetőséget a Fájlformátum szakaszban, a következő tulajdonságok jelennek meg az előugró Fájlformátum beállításai párbeszédpanelen.

Képernyőkép a fájlformátum kiválasztásáról.

  • Tömörítés típusa: Az XML-fájlok olvasásához használt tömörítési kodek. A legördülő listában választhat a Nincs, a bzip2, a gzip, a deflát, a ZipDeflate, a TarGZip vagy a tar típus közül.

    Ha tömörítési típusként a ZipDeflate lehetőséget választja, a Zip-fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.

    • Zip-fájlnév megőrzése mappaként: Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappaszerkezetként.
      • Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás kibontott fájlokat ír a fájlba <specified file path>/<folder named as source zip file>/.
      • Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás a kibontott fájlokat közvetlenül a fájlba <specified file path>írja. Győződjön meg arról, hogy nincsenek ismétlődő fájlnevek a különböző forrás zip-fájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.

    Ha a TarGZip/tar formátumot választja tömörítési típusként, a Tömörítési fájlnév megőrzése mappaként a Forrás lap Speciális beállításai alatt jelenik meg.

    • A tömörítési fájl nevének megőrzése mappaként: Azt jelzi, hogy a forrásként tömörített fájlnevet mappaszerkezetként szeretné-e megőrizni a másolás során.
      • Ha ez a jelölőnégyzet be van jelölve (alapértelmezett), a szolgáltatás tömörített fájlokat ír a fájlba <specified file path>/<folder named as source compressed file>/.
      • Ha ez a jelölőnégyzet nincs bejelölve, a szolgáltatás közvetlenül <specified file path>ide írja a tömörített fájlokat. Győződjön meg arról, hogy nem duplikált fájlnevek szerepelnek a különböző forrásfájlokban, hogy elkerülje a versenyzést vagy a váratlan viselkedést.
  • Tömörítési szint: A tömörítési típus kiválasztásakor adja meg a tömörítési arányt. Választhat a Leggyorsabb vagy az Optimális lehetőség közül.

    • Leggyorsabb: A tömörítési műveletnek a lehető leggyorsabban végre kell hajtania, még akkor is, ha az eredményül kapott fájl nincs optimálisan tömörítve.
    • Optimális: A tömörítési műveletet optimálisan kell tömöríteni, még akkor is, ha a művelet végrehajtása hosszabb időt vesz igénybe. További információ: Tömörítési szint témakör.
  • Kódolás: Adja meg a tesztfájlok írásához használt kódolási típust. Válasszon egy típust a legördülő listából. Az alapértelmezett érték az UTF-8.

  • Null érték: A null érték sztring-ábrázolását adja meg. Az alapértelmezett érték üres sztring.

A Forrás lapon a Speciális beállítások területen a következő XML-formátumhoz kapcsolódó tulajdonságok jelennek meg.

  • Érvényesítési mód: Meghatározza, hogy érvényesítse-e az XML-sémát. Válasszon ki egy módot a legördülő listából.

    • Nincs: Ezt a lehetőséget választva nem használhat érvényesítési módot.
    • xsd: Ezt választva ellenőrizheti az XML-sémát az XSD használatával.
    • dtd: Ezt választva érvényesítheti az XML-sémát a DTD használatával.

    Képernyőkép az érvényesítési módokról.

  • Névterek: Adja meg, hogy engedélyezi-e a névteret az XML-fájlok elemzésekor. Alapértelmezés szerint ki van jelölve.

  • Névtér előtagpárok: Ha a névterek engedélyezve van, válassza az + Új lehetőséget, és adja meg az URL-címet és az előtagot. További párok hozzáadásához válassza az + Új lehetőséget.
    Az XML-fájl elemzésekor a névtér URI-jának használata az előtag-leképezéshez a mezők elnevezésére szolgál. Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel. Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve .prefix:fieldName

    Képernyőkép a névtér előtagpárjairól.

  • Adattípus észlelése: Megadhatja, hogy az egész, a dupla és a logikai adattípust észlelje-e. Alapértelmezés szerint ki van jelölve.

Táblázat összefoglalása

XML mint forrás

Xml-formátum használata esetén a másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak.

Név Leírás Érték Szükséges JSON-szkripttulajdonság
Fájlformátum A használni kívánt fájlformátum. XML Igen típus (alatt datasetSettings):
Xml
Tömörítés típusa Az XML-fájlok olvasásához használt tömörítési kodek. Egyik sem
bzip2
gzip
csökkent
ZipDeflate
TarGZip
kátrány
Nem típus (alatt compression):

bzip2
gzip
csökkent
ZipDeflate
TarGZip
kátrány
Tömörítési szint  A tömörítési arány. Leggyorsabb
Optimális 
Nem szint (alatt compression):
Leggyorsabb
Optimális
Kódolás A tesztfájlok olvasásához használt kódolási típus. "UTF-8" (alapértelmezés szerint),"UTF-8 BOM nélkül", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865"869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Nem encodingName
Zip-fájlnév megőrzése mappaként Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás zip-fájl nevét mappastruktúraként. Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése Nem preserveZipFileNameAsFolder
(alatt compressionProperties->type as ZipDeflateReadSettings):
igaz (alapértelmezett) vagy hamis
Tömörítési fájlnév megőrzése mappaként Azt jelzi, hogy a másolás során meg kell-e őrizni a forrás tömörített fájlnevét mappaszerkezetként. Kiválasztva (alapértelmezett) vagy a kijelölés megszüntetése Nem preserveCompressionFileNameAsFolder
(alatt compressionProperties->type mint vagy TarReadSettingsTarGZipReadSettings):
igaz (alapértelmezett) vagy hamis
Null érték A null érték sztring-ábrázolása. <a null érték>
üres sztring (alapértelmezés szerint)
Nem nullValue
Érvényesítési mód Ellenőrizze az XML-sémát. Egyik sem
xsd
Dtd
Nem validationMode:

xsd
Dtd
Névterek A névtér engedélyezése az XML-fájlok elemzésekor. Ki van jelölve (alapértelmezett) vagy nincs kijelölve Nem névterek:
igaz (alapértelmezett) vagy hamis
Névtér előtagpárjai Névtér URI az előtag-leképezéshez, amely az XML-fájl elemzésekor a mezők elnevezésére szolgál.
Ha egy XML-fájl rendelkezik névtérrel, és a névtér engedélyezve van, a mezőnév alapértelmezés szerint megegyezik az XML-dokumentumban szereplő névvel.
Ha a térképen a névtér URI-jának egy eleme van definiálva, akkor a mező neve .prefix:fieldName
< url >:< előtag > Nem namespacePrefixes:
< url >:< előtag >
Adattípus észlelése Az egész szám, a dupla és a logikai adattípus észlelése. Ki van jelölve (alapértelmezett) vagy nincs kijelölve Nem detectDataType:
igaz (alapértelmezett) vagy hamis