XML-format i Data Factory i Microsoft Fabric
Denne artikkelen beskriver hvordan du konfigurerer XML-format i datasamlebåndet til Data Factory i Microsoft Fabric.
XML-format støttes for følgende aktiviteter og koblinger som kilde.
Kategori | Kobling/aktivitet |
---|---|
Støttet kobling | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob-lagring | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Støttet aktivitet | Kopier aktivitet (kilde/-) |
Oppslagsaktivitet | |
GetMetadata-aktivitet | |
Slett aktivitet |
Hvis du vil konfigurere XML-format, velger du tilkoblingen i datakilden for kopieringsaktivitet for datasamlebånd, og deretter velger du XML i rullegardinlisten i Filformat. Velg Innstillinger for videre konfigurasjon av dette formatet.
Når du har valgt Innstillinger i Filformat-delen, vises følgende egenskaper i dialogboksen innstillinger for popup-filformat.
Komprimeringstype: Komprimeringskodecen som brukes til å lese XML-filer. Du kan velge mellom Ingen, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tjæretype i rullegardinlisten.
Hvis du velger ZipDeflate som komprimeringstype, vil Behold zip-filnavn som mappe vises under Avanserte innstillinger i kategorien Kilde .
- Behold zip-filnavn som mappe: Angir om du vil beholde filnavnet for kilden som en mappestruktur under kopieringen.
- Hvis denne boksen er avmerket (standard), skriver tjenesten filer som ikke er pakket ut, til
<specified file path>/<folder named as source zip file>/
. - Hvis det ikke er merket av for denne boksen, skriver tjenesten filer som ikke er pakket ut direkte til
<specified file path>
. Kontroller at du ikke har dupliserte filnavn i ulike zip-filer for kilde for å unngå racing eller uventet oppførsel.
- Hvis denne boksen er avmerket (standard), skriver tjenesten filer som ikke er pakket ut, til
Hvis du velger TarGZip/tjære som komprimeringstype, vil Behold komprimeringsfilnavnet som mappe vises under Avanserte innstillinger i kategorien Kilde .
- Behold navnet på komprimeringsfilen som mappe: Angir om kildekomprimert filnavn skal bevares som en mappestruktur under kopieringen.
- Hvis denne boksen er avmerket (standard), skriver tjenesten dekomprimerte filer til
<specified file path>/<folder named as source compressed file>/
. - Hvis denne boksen ikke er avmerket, skriver tjenesten dekomprimerte filer direkte til
<specified file path>
. Kontroller at du ikke har dupliserte filnavn i forskjellige kildefiler for å unngå racing eller uventet oppførsel.
- Hvis denne boksen er avmerket (standard), skriver tjenesten dekomprimerte filer til
- Behold zip-filnavn som mappe: Angir om du vil beholde filnavnet for kilden som en mappestruktur under kopieringen.
Komprimeringsnivå: Angi komprimeringsforholdet når du velger en komprimeringstype. Du kan velge mellom Raskeste eller Optimal.
- Raskest: Komprimeringsoperasjonen bør fullføres så raskt som mulig, selv om den resulterende filen ikke er optimalt komprimert.
- Optimal: Komprimeringsoperasjonen bør komprimeres optimalt, selv om operasjonen tar lengre tid å fullføre. Hvis du vil ha mer informasjon, kan du se emnet Komprimeringsnivå.
Koding: Angi kodingstypen som brukes til å skrive testfiler. Velg én type fra rullegardinlisten. Standardverdien er UTF-8.
Nullverdi: Angir strengpresentasjonen av nullverdi. Standardverdien er tom streng.
Under Avanserte innstillinger i kildefanen vises følgende XML-formatrelaterte egenskaper.
Valideringsmodus: Angir om XML-skjemaet skal valideres. Velg én modus fra rullegardinlisten.
- Ingen: Velg dette for ikke å bruke valideringsmodus.
- xsd: Velg dette alternativet for å validere XML-skjemaet ved hjelp av XSD.
- dtd: Velg dette alternativet for å validere XML-skjemaet ved hjelp av DTD.
Navneområder: Angi om du vil aktivere navneområde når du analyserer XML-filene. Den er valgt som standard.
Prefikspar for navneområde: Hvis navneområdene er aktivert, velger du + Ny og angir URL-adressen og prefikset. Du kan legge til flere par ved å velge + Ny.
Navneområde-URI til prefikstilordning brukes til å navngi felt når xml-filen analyseres. Hvis en XML-fil har navneområde og navneområde er aktivert, er feltnavnet som standard det samme som det er i XML-dokumentet. Hvis det er definert et element for URI-en for navneområdet i dette kartet, erprefix:fieldName
feltnavnet .Oppdag datatype: Angi om det skal oppdages heltall, dobbeltrom og boolske datatyper. Den er valgt som standard.
Følgende egenskaper støttes i delen kilde for kopieringsaktivitet når du bruker XML-format.
Navn | Beskrivelse | Verdi | Påkrevd | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Filformatet du vil bruke. | XML | Ja | type (under datasetSettings ):XML |
Komprimeringstype | Komprimeringskodecen som brukes til å lese XML-filer. | None bzip2 gzip Deflate ZipDeflate TarGZip tjære |
No | type (under compression ): bzip2 gzip Deflate ZipDeflate TarGZip tjære |
Komprimeringsnivå | Komprimeringsforholdet. | Raskeste Optimal |
Nei | nivå (under compression ): Raskeste Optimal |
Koding | Kodingstypen som brukes til å lese testfiler. | "UTF-8" (som standard),"UTF-8 uten stykkliste", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252" "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nei | kodingsnavn |
Behold zip-filnavn som mappe | Angir om kildefilnavnet skal beholdes som en mappestruktur under kopieringen. | Valgt (standard) eller fjern merking | No | preserveZipFileNameAsFolder (under compressionProperties ->type som ZipDeflateReadSettings ):sann (standard) eller usann |
Behold navnet på komprimeringsfilen som mappe | Angir om kildekomprimerte filnavn skal bevares som en mappestruktur under kopieringen. | Valgt (standard) eller fjern merking | No | preserveCompressionFileNameAsFolder (under compressionProperties ->type som TarGZipReadSettings eller TarReadSettings ):sann (standard) eller usann |
Nullverdi | Strengpresentasjonen av nullverdi. | <nullverdien> tom streng (som standard) |
Nei | nullValue |
Valideringsmodus | Om XML-skjemaet skal valideres. | None xsd Dtd |
No | validationMode: xsd Dtd |
Navneområder | Om du vil aktivere navneområde når du analyserer XML-filene. | Valgt (standard) eller umerket | No | navneområder: sann (standard) eller usann |
Prefikspar for navneområde | Navneområde-URI til prefikstilordning, som brukes til å navngi felt når xml-filen analyseres. Hvis en XML-fil har navneområde og navneområde er aktivert, er feltnavnet som standard det samme som det er i XML-dokumentet. Hvis det er definert et element for URI-en for navneområdet i dette kartet, er prefix:fieldName feltnavnet . |
<url:><prefiks> | No | navneområdePrefixes: <url:><prefiks> |
Oppdag datatype | Om du vil finne heltall, doble og boolske datatyper. | Valgt (standard) eller umerket | No | detectDataType: sann (standard) eller usann |