XML-format i Data Factory i Microsoft Fabric
Den här artikeln beskriver hur du konfigurerar XML-format i datapipelinen för Data Factory i Microsoft Fabric.
XML-format stöds för följande aktiviteter och anslutningsappar som källa.
Kategori | Anslutningsapp/aktivitet |
---|---|
Anslutningsprogram som stöds | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-filer | |
Oracle Cloud Storage | |
SFTP | |
Aktivitet som stöds | aktiviteten Kopiera (källa/-) |
Sökningsaktivitet | |
GetMetadata-aktivitet | |
Ta bort aktivitet |
Om du vill konfigurera XML-format väljer du din anslutning i datapipeline-kopieringsaktivitetens källa och väljer sedan XML i listrutan med Filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.
När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.
Komprimeringstyp: Den komprimeringskodc som används för att läsa XML-filer. Du kan välja mellan None, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tar type i listrutan.
Om du väljer ZipDeflate som komprimeringstyp visas Spara zip-filnamn som mapp under de avancerade inställningarna på fliken Källa .
- Bevara zip-filnamnet som mapp: Anger om du vill behålla namnet på zip-källfilen som en mappstruktur under kopiering.
- Om den här rutan är markerad (standard) skriver tjänsten uppackade filer till
<specified file path>/<folder named as source zip file>/
. - Om den här rutan är avmarkerad skriver tjänsten uppackade filer direkt till
<specified file path>
. Kontrollera att du inte har duplicerade filnamn i olika zip-källfiler för att undvika racing eller oväntat beteende.
- Om den här rutan är markerad (standard) skriver tjänsten uppackade filer till
Om du väljer TarGZip/tjära som komprimeringstyp visas Bevara komprimeringsfilens namn som mapp under avancerade inställningar på fliken Källa.
- Bevara komprimeringsfilens namn som mapp: Anger om det komprimerade källfilnamnet ska behållas som en mappstruktur under kopieringen.
- Om den här rutan är markerad (standard) skriver tjänsten dekomprimerade filer till
<specified file path>/<folder named as source compressed file>/
. - Om den här rutan är avmarkerad skriver tjänsten dekomprimerade filer direkt till
<specified file path>
. Kontrollera att du inte har duplicerade filnamn i olika källfiler för att undvika racing eller oväntat beteende.
- Om den här rutan är markerad (standard) skriver tjänsten dekomprimerade filer till
- Bevara zip-filnamnet som mapp: Anger om du vill behålla namnet på zip-källfilen som en mappstruktur under kopiering.
Komprimeringsnivå: Ange komprimeringsförhållandet när du väljer en komprimeringstyp. Du kan välja mellan Snabbaste eller Optimal.
- Snabbast: Komprimeringsåtgärden bör slutföras så snabbt som möjligt, även om den resulterande filen inte komprimeras optimalt.
- Optimal: Komprimeringsåtgärden bör komprimeras optimalt, även om åtgärden tar längre tid att slutföra. Mer information finns i avsnittet Komprimeringsnivå.
Kodning: Ange den kodningstyp som används för att skriva testfiler. Välj en typ i listrutan. Standardvärdet är UTF-8.
Null-värde: Anger strängrepresentationen av null-värdet. Standardvärdet är tom sträng.
Under Avancerade inställningar på fliken Källa visas följande XML-formatrelaterade egenskaper.
Valideringsläge: Anger om XML-schemat ska verifieras. Välj ett läge i listrutan.
- Ingen: Välj det här alternativet om du inte vill använda valideringsläget.
- xsd: Välj detta för att verifiera XML-schemat med XSD.
- dtd: Välj detta för att verifiera XML-schemat med hjälp av DTD.
Namnområden: Ange om namnområdet ska aktiveras när XML-filerna parsas. Den är markerad som standard.
Namnområdesprefixpar: Om namnrymderna är aktiverade väljer du + Ny och anger URL:en och prefixet. Du kan lägga till fler par genom att välja + Ny.
Namnområdes-URI till prefixmappning används för att namnge fält när XML-filen parsas. Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet. Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan ärprefix:fieldName
fältnamnet .Identifiera datatyp: Ange om du vill identifiera heltal, dubbla och booleska datatyper. Den är markerad som standard.
Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder XML-format.
Namn | Beskrivning | Värde | Krävs | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Det filformat som du vill använda. | XML | Ja | typ (under datasetSettings ):Xml |
Komprimeringstyp | Komprimeringskodcen som används för att läsa XML-filer. | None bzip2 gzip Tömma ZipDeflate TarGZip tjära |
Nej | typ (under compression ): bzip2 gzip Tömma ZipDeflate TarGZip tjära |
Komprimeringsnivå | Komprimeringsförhållandet. | Snabbast Optimal |
Nej | nivå (under compression ): Snabbast Optimal |
Kodning | Kodningstypen som används för att läsa testfiler. | "UTF-8" (som standard),"UTF-8 utan BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864 ", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", ""ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO--8859-7", "ISO-8859-8" 8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS -1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nej | encodingName |
Bevara zip-filnamnet som mapp | Anger om käll-zip-filnamnet ska bevaras som en mappstruktur under kopiering. | Markerad (standard) eller avmarkera | Nej | preserveZipFileNameAsFolder (under compressionProperties ->type som ZipDeflateReadSettings ):sant (standard) eller falskt |
Bevara komprimeringsfilens namn som mapp | Anger om källans komprimerade filnamn ska bevaras som en mappstruktur under kopieringen. | Markerad (standard) eller avmarkera | Nej | preserveCompressionFileNameAsFolder (under compressionProperties ->type som TarGZipReadSettings eller TarReadSettings ):sant (standard) eller falskt |
Null-värde | Strängrepresentationen av null-värdet. | <ditt null-värde> tom sträng (som standard) |
Nej | nullValue |
Valideringsläge | Om XML-schemat ska verifieras. | None xsd Dtd |
Nej | validationMode: xsd Dtd |
Namnområden | Om du vill aktivera namnområdet när XML-filerna parsas. | Markerad (standard) eller omarkerad | Nej | namnområden: sant (standard) eller falskt |
Namnområdesprefixpar | Namnområdes-URI till prefixmappning, som används för att namnge fält vid parsning av XML-filen. Om en XML-fil har namnområdet och namnområdet är aktiverat är fältnamnet som standard detsamma som i XML-dokumentet. Om det finns ett objekt som definierats för namnområdes-URI:n i den här kartan är prefix:fieldName fältnamnet . |
< url >:< prefix > | Nej | namespacePrefixes: < url >:< prefix > |
Identifiera datatyp | Om du vill identifiera heltals-, dubbel- och booleska datatyper. | Markerad (standard) eller omarkerad | Nej | detectDataType: sant (standard) eller falskt |