Dela via


XML-format i Data Factory i Microsoft Fabric

Den här artikeln beskriver hur du konfigurerar XML-format i datapipelinen för Data Factory i Microsoft Fabric.

Funktioner som stöds

XML-format stöds för följande aktiviteter och anslutningsappar som källa.

Kategori Anslutningsapp/aktivitet
Anslutningsprogram som stöds Amazon S3
Amazon S3-kompatibel
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Filsystem
FTP
Google Cloud Storage
HTTP
Lakehouse-filer
Oracle Cloud Storage
SFTP
Aktivitet som stöds Kopieringsaktivitet (källa/-)
Sökningsaktivitet
GetMetadata-aktivitet
Ta bort aktivitet

XML-format i kopieringsaktivitet

Om du vill konfigurera XML-format väljer du din anslutning i datapipeline-kopieringsaktivitetens källa och väljer sedan XML i listrutan med Filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.

Skärmbild som visar inställningar för filformat.

XML som källa

När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.

Skärmbild som visar val av filformat.

  • Komprimeringstyp: Den komprimeringskodc som används för att läsa XML-filer. Du kan välja mellan None, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tar type i listrutan.

    Om du väljer ZipDeflate som komprimeringstyp visas Spara zip-filnamn som mapp under de avancerade inställningarna på fliken Källa .

    • Bevara zip-filnamnet som mapp: Anger om du vill behålla namnet på zip-källfilen som en mappstruktur under kopiering.
      • Om den här rutan är markerad (standard) skriver tjänsten uppackade filer till <specified file path>/<folder named as source zip file>/.
      • Om den här rutan är avmarkerad skriver tjänsten uppackade filer direkt till <specified file path>. Kontrollera att du inte har duplicerade filnamn i olika zip-källfiler för att undvika racing eller oväntat beteende.

    Om du väljer TarGZip/tjära som komprimeringstyp visas Bevara komprimeringsfilens namn som mapp under avancerade inställningar på fliken Källa.

    • Bevara komprimeringsfilens namn som mapp: Anger om det komprimerade källfilnamnet ska behållas som en mappstruktur under kopieringen.
      • Om den här rutan är markerad (standard) skriver tjänsten dekomprimerade filer till <specified file path>/<folder named as source compressed file>/.
      • Om den här rutan är avmarkerad skriver tjänsten dekomprimerade filer direkt till <specified file path>. Kontrollera att du inte har duplicerade filnamn i olika källfiler för att undvika racing eller oväntat beteende.
  • Komprimeringsnivå: Ange komprimeringsförhållandet när du väljer en komprimeringstyp. Du kan välja mellan Snabbaste eller Optimal.

    • Snabbast: Komprimeringsåtgärden bör slutföras så snabbt som möjligt, även om den resulterande filen inte komprimeras optimalt.
    • Optimal: Komprimeringsåtgärden bör komprimeras optimalt, även om åtgärden tar längre tid att slutföra. Mer information finns i avsnittet Komprimeringsnivå.
  • Kodning: Ange den kodningstyp som används för att skriva testfiler. Välj en typ i listrutan. Standardvärdet är UTF-8.

  • Null-värde: Anger strängrepresentationen av null-värdet. Standardvärdet är tom sträng.

Under Avancerade inställningar på fliken Källa visas följande XML-formatrelaterade egenskaper.

  • Valideringsläge: Anger om XML-schemat ska verifieras. Välj ett läge i listrutan.

    • Ingen: Välj det här alternativet om du inte vill använda valideringsläget.
    • xsd: Välj detta för att verifiera XML-schemat med XSD.
    • dtd: Välj detta för att verifiera XML-schemat med hjälp av DTD.

    Skärmbild som visar valideringslägen.

  • Namnområden: Ange om namnområdet ska aktiveras när XML-filerna parsas. Den är markerad som standard.

  • Namnområdesprefixpar: Om namnrymderna är aktiverade väljer du + Ny och anger URL:en och prefixet. Du kan lägga till fler par genom att välja + Ny.
    Namnområdes-URI till prefixmappning används för att namnge fält när XML-filen parsas. Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet. Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan är prefix:fieldNamefältnamnet .

    Skärmbild som visar namnområdesprefixpar.

  • Identifiera datatyp: Ange om du vill identifiera heltal, dubbla och booleska datatyper. Den är markerad som standard.

Tabellsammanfattning

XML som källa

Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder XML-format.

Namn Beskrivning Värde Krävs JSON-skriptegenskap
Filformat Det filformat som du vill använda. XML Ja typ (under datasetSettings):
Xml
Komprimeringstyp Komprimeringskodcen som används för att läsa XML-filer. None
bzip2
gzip
Tömma
ZipDeflate
TarGZip
tjära
Nej typ (under compression):

bzip2
gzip
Tömma
ZipDeflate
TarGZip
tjära
Komprimeringsnivå  Komprimeringsförhållandet. Snabbast
Optimal 
Nej nivå (under compression):
Snabbast
Optimal
Kodning Kodningstypen som används för att läsa testfiler. "UTF-8" (som standard),"UTF-8 utan BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864 ", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", ""ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO--8859-7", "ISO-8859-8" 8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS -1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Nej encodingName
Bevara zip-filnamnet som mapp Anger om käll-zip-filnamnet ska bevaras som en mappstruktur under kopiering. Markerad (standard) eller avmarkera Nej preserveZipFileNameAsFolder
(under compressionProperties->type som ZipDeflateReadSettings):
sant (standard) eller falskt
Bevara komprimeringsfilens namn som mapp Anger om källans komprimerade filnamn ska bevaras som en mappstruktur under kopieringen. Markerad (standard) eller avmarkera Nej preserveCompressionFileNameAsFolder
(under compressionProperties->type som TarGZipReadSettings eller TarReadSettings):
sant (standard) eller falskt
Null-värde Strängrepresentationen av null-värdet. <ditt null-värde>
tom sträng (som standard)
Nej nullValue
Valideringsläge Om XML-schemat ska verifieras. None
xsd
Dtd
Nej validationMode:

xsd
Dtd
Namnområden Om du vill aktivera namnområdet när XML-filerna parsas. Markerad (standard) eller omarkerad Nej namnområden:
sant (standard) eller falskt
Namnområdesprefixpar Namnområdes-URI till prefixmappning, som används för att namnge fält vid parsning av XML-filen.
Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet.
Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan är prefix:fieldNamefältnamnet .
< url >:< prefix > Nej namespacePrefixes:
< url >:< prefix >
Identifiera datatyp Om du vill identifiera heltals-, dubbel- och booleska datatyper. Markerad (standard) eller omarkerad Nej detectDataType:
sant (standard) eller falskt