XML-format i Data Factory i Microsoft Fabric

Den här artikeln beskriver hur du konfigurerar XML-format i datapipelinen för Data Factory i Microsoft Fabric.

Funktioner som stöds

XML-format stöds för följande aktiviteter och anslutningsappar som källa.

Kategori Anslut eller/aktivitet
Anslutningsprogram som stöds Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
FTP
Google Cloud Storage
HTTP
SFTP
Aktivitet som stöds aktiviteten Kopiera
Sökningsaktivitet
GetMetadata-aktivitet
Ta bort aktivitet

XML-format i kopieringsaktivitet

Om du vill konfigurera XML-format väljer du din anslutning i datapipeline-kopieringsaktivitetens källa och väljer sedan XML i listrutan med Filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.

Screenshot showing file format settings.

XML som källa

När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.

Screenshot showing selecting file format.

  • Komprimeringstyp: Den komprimeringskodc som används för att läsa XML-filer. Du kan välja mellan None, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tar type i listrutan.

    Om du väljer ZipDeflate som komprimeringstyp visas Spara zip-filnamn som mapp under de avancerade inställningarna på fliken Källa .

    • Bevara zip-filnamnet som mapp: Anger om du vill behålla namnet på zip-källfilen som en mappstruktur under kopiering.
      • Om den här rutan är markerad (standard) skriver tjänsten uppackade filer till <specified file path>/<folder named as source zip file>/.
      • Om den här rutan är avmarkerad skriver tjänsten uppackade filer direkt till <specified file path>. Kontrollera att du inte har duplicerade filnamn i olika zip-källfiler för att undvika racing eller oväntat beteende.

    Om du väljer TarGZip/tjära som komprimeringstyp visas Bevara komprimeringsfilens namn som mapp under avancerade inställningar på fliken Källa.

    • Bevara komprimeringsfilens namn som mapp: Anger om det komprimerade källfilnamnet ska behållas som en mappstruktur under kopieringen.
      • Om den här rutan är markerad (standard) skriver tjänsten dekomprimerade filer till <specified file path>/<folder named as source compressed file>/.
      • Om den här rutan är avmarkerad skriver tjänsten dekomprimerade filer direkt till <specified file path>. Kontrollera att du inte har duplicerade filnamn i olika källfiler för att undvika racing eller oväntat beteende.
  • Komprimeringsnivå: Ange komprimeringsförhållandet när du väljer en komprimeringstyp. Du kan välja mellan Snabbaste eller Optimal.

    • Snabbast: Komprimeringsåtgärden bör slutföras så snabbt som möjligt, även om den resulterande filen inte komprimeras optimalt.
    • Optimal: Komprimeringsåtgärden bör komprimeras optimalt, även om åtgärden tar längre tid att slutföra. Mer information finns i avsnittet Komprimeringsnivå.
  • Kodning: Ange den kodningstyp som används för att skriva testfiler. Välj en typ i listrutan. Standardvärdet är UTF-8.

  • Null-värde: Anger strängrepresentationen av null-värdet. Standardvärdet är tom sträng.

Under Avancerade inställningar på fliken Källa visas följande XML-formatrelaterade egenskaper.

  • Valideringsläge: Anger om XML-schemat ska verifieras. Välj ett läge i listrutan.

    • Ingen: Välj det här alternativet om du inte vill använda valideringsläget.
    • xsd: Välj detta för att verifiera XML-schemat med XSD.
    • dtd: Välj detta för att verifiera XML-schemat med hjälp av DTD.

    Screenshot showing validation modes.

  • Namnområden: Ange om namnområdet ska aktiveras när XML-filerna parsas. Den är markerad som standard.

  • Namnområdesprefixpar: Om namnrymderna är aktiverade väljer du + Ny och anger URL:en och prefixet. Du kan lägga till fler par genom att välja + Ny.
    Namnområdes-URI till prefixmappning används för att namnge fält när XML-filen parsas. Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet. Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan är prefix:fieldNamefältnamnet .

    Screenshot showing namespace prefix pairs.

  • Identifiera datatyp: Ange om du vill identifiera heltal, dubbla och booleska datatyper. Den är markerad som standard.

Tabellsammanfattning

XML som källa

Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder XML-format.

Namn Beskrivning Värde Krävs JSON-skriptegenskap
Filformat Det filformat som du vill använda. XML Ja typ (under datasetSettings):
Xml
Komprimeringstyp Komprimeringskodcen som används för att läsa XML-filer. None
bzip2
Gzip
Tömma
ZipDeflate
TarGZip
tjära
Nej typ (under compression):

bzip2
gzip
Tömma
ZipDeflate
TarGZip
tjära
Komprimeringsnivå  Komprimeringsförhållandet. Snabbaste
Optimal 
Nej nivå (under compression):
Snabbaste
Optimal
Kodning Kodningstypen som används för att läsa testfiler. "UTF-8" (som standard),"UTF-8 utan BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864 ", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", ""ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO--8859-7", "ISO-8859-8" 8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS -1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Nej encodingName
Bevara zip-filnamnet som mapp Anger om käll-zip-filnamnet ska bevaras som en mappstruktur under kopiering. Markerad (standard) eller avmarkera Nej preserveZipFileNameAsFolder
(under compressionProperties->type som ZipDeflateReadSettings):
sant (standard) eller falskt
Bevara komprimeringsfilens namn som mapp Anger om källans komprimerade filnamn ska bevaras som en mappstruktur under kopieringen. Markerad (standard) eller avmarkera Nej preserveCompressionFileNameAsFolder
(under compressionProperties->type som TarGZipReadSettings eller TarReadSettings):
sant (standard) eller falskt
Null-värde Strängrepresentationen av null-värdet. <ditt null-värde>
tom sträng (som standard)
Nej nullValue
Valideringsläge Om XML-schemat ska verifieras. None
Xsd
Dtd
Nej validationMode:

Xsd
Dtd
Namnområden Om du vill aktivera namnområdet när XML-filerna parsas. Markerad (standard) eller omarkerad Nej Namnområden:
sant (standard) eller falskt
Namnområdesprefixpar Namnområdes-URI till prefixmappning, som används för att namnge fält vid parsning av XML-filen.
Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet.
Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan är prefix:fieldNamefältnamnet .
< url >:< prefix > Nej namespacePrefixes:
< url >:< prefix >
Identifiera datatyp Om du vill identifiera heltals-, dubbel- och booleska datatyper. Markerad (standard) eller omarkerad Nej detectDataType:
sant (standard) eller falskt