XML-format i Data Factory i Microsoft Fabric

I denne artikel beskrives det, hvordan du konfigurerer XML-format i datapipelinen for Data Factory i Microsoft Fabric.

Understøttede funktioner

XML-format understøttes for følgende aktiviteter og forbindelser som kilde.

Kategori Forbind or/aktivitet
Understøttet connector Amazon S3
Azure Blob Storage
Azure Data Lake-lagring Gen1
Azure Data Lake Storage Gen2
FTP
Google Cloud Storage
HTTP
SFTP
Understøttet aktivitet Kopiér aktivitet
Opslagsaktivitet
GetMetadata-aktivitet
Slet aktivitet

XML-format i kopiaktivitet

Hvis du vil konfigurere XML-format, skal du vælge din forbindelse i kilden til kopieringsaktiviteten for datapipelinen og derefter vælge XML på rullelisten i Filformat. Vælg Indstillinger for yderligere konfiguration af dette format.

Screenshot showing file format settings.

XML som kilde

Når du har valgt Indstillinger i afsnittet Filformat, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.

Screenshot showing selecting file format.

  • Komprimeringstype: Den komprimeringscodec, der bruges til at læse XML-filer. Du kan vælge mellem Ingen, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tjæretype på rullelisten.

    Hvis du vælger ZipDeflate som komprimeringstype, vises Bevar zip-filnavnet som mappe under Avancerede indstillinger under fanen Kilde.

    • Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
      • Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til <specified file path>/<folder named as source zip file>/.
      • Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten ikke-pakkede filer direkte til <specified file path>. Sørg for, at du ikke har duplikerede filnavne i forskellige kilde zip-filer for at undgå væddeløb eller uventet funktionsmåde.

    Hvis du vælger TarGZip/tar som komprimeringstype, vises Bevar komprimeringsfilnavnet som mappe under avancerede indstillinger under fanen Kilde.

    • Bevar komprimeringsfilnavnet som mappe: Angiver, om det komprimerede kildefilnavn skal bevares som en mappestruktur under kopiering.
      • Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til <specified file path>/<folder named as source compressed file>/.
      • Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten dekomprimerede filer direkte til <specified file path>. Sørg for, at du ikke har duplikerede filnavne i forskellige kildefiler for at undgå væddeløb eller uventet funktionsmåde.
  • Komprimeringsniveau: Angiv komprimeringsforholdet, når du vælger en komprimeringstype. Du kan vælge mellem Hurtigste eller Optimal.

    • Hurtigst: Komprimeringshandlingen skal fuldføres så hurtigt som muligt, selvom den resulterende fil ikke komprimeres optimalt.
    • Optimal: Komprimeringshandlingen skal komprimeres optimalt, selvom handlingen tager længere tid at fuldføre. Du kan få flere oplysninger under Emnet Komprimeringsniveau.
  • Kodning: Angiv den kodningstype, der skal bruges til at skrive testfiler. Vælg én type på rullelisten. Standardværdien er UTF-8.

  • Null-værdi: Angiver strengrepræsentationen af null-værdien. Standardværdien er en tom streng.

Under Avancerede indstillinger under fanen Kilde vises følgende egenskaber for XML-format.

  • Valideringstilstand: Angiver, om XML-skemaet skal valideres. Vælg én tilstand på rullelisten.

    • Ingen: Vælg dette for ikke at bruge valideringstilstand.
    • xsd: Vælg dette for at validere XML-skemaet ved hjælp af XSD.
    • dtd: Vælg dette for at validere XML-skemaet ved hjælp af DTD.

    Screenshot showing validation modes.

  • Navneområder: Angiv, om navneområdet skal aktiveres, når XML-filerne fortolkes. Den er valgt som standard.

  • Præfikspar for navneområde: Hvis navneområder er aktiveret, skal du vælge + Ny og angive URL-adressen og præfikset. Du kan tilføje flere par ved at vælge + Ny.
    URI for navneområde til præfikstilknytning bruges til at navngive felter, når XML-filen fortolkes. Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet. Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, er prefix:fieldNamefeltnavnet .

    Screenshot showing namespace prefix pairs.

  • Registrer datatype: Angiv, om der skal registreres heltals-, dobbelt- og booleske datatyper. Den er valgt som standard.

Tabeloversigt

XML som kilde

Følgende egenskaber understøttes i afsnittet kopiaktivitetskilde, når du bruger XML-format.

Navn Beskrivelse Værdi Kræves JSON-scriptegenskab
Filformat Det filformat, du vil bruge. XML Ja type (under datasetSettings):
Xml
Komprimeringstype Den komprimeringscodec, der bruges til at læse XML-filer. Ingen
bzip2
Gzip
Deflatere
ZipDeflate
TarGZip
Tar
Nr. type (under compression):

bzip2
Gzip
Deflatere
ZipDeflate
TarGZip
Tar
Komprimeringsniveau  Komprimeringsforholdet. Hurtigste
Optimal 
Nej niveau (under compression):
Hurtigste
Optimal
Kodning Den kodningstype, der bruges til at læse testfiler. "UTF-8" (som standard),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM 869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Nej encodingName
Bevar zip-filnavnet som mappe Angiver, om zip-kildefilnavnet skal bevares som en mappestruktur under kopiering. Markeret (standard) eller fravælg Nr. preserveZipFileNameAsFolder
(under compressionProperties->type som ZipDeflateReadSettings):
true (standard) eller false
Bevar komprimering af filnavnet som mappe Angiver, om kildens komprimerede filnavn skal bevares som en mappestruktur under kopiering. Markeret (standard) eller fravælg Nr. preserveCompressionFileNameAsFolder
(under compressionProperties->type som TarGZipReadSettings eller TarReadSettings):
true (standard) eller false
Null-værdi Strengrepræsentationen af null-værdien. <din null-værdi>
tom streng (som standard)
Nej nullValue
Valideringstilstand Angiver, om XML-skemaet skal valideres. Ingen
Xsd
Dtd
Nr. validationMode:

Xsd
Dtd
Navneområder Angiver, om navneområdet skal aktiveres, når XML-filerne fortolkes. Markeret (standard) eller ikke markeret Nr. Navneområder:
true (standard) eller false
Præfikspar for navneområde URI for navneområde til præfikstilknytning, som bruges til at navngive felter, når XML-filen fortolkes.
Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet.
Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, er prefix:fieldNamefeltnavnet .
< url >:< præfiks > Nr. namespacePrefixes:
< url >:< præfiks >
Registrer datatype Angiver, om der skal registreres heltals-, dobbelt- og booleske datatyper. Markeret (standard) eller ikke markeret Nr. detectDataType:
true (standard) eller false