Leggere in inglese

Condividi tramite


Formato XML in Data Factory in Microsoft Fabric

Questo articolo spiega come configurare il formato XML nella pipeline di dati di Data Factory in Microsoft Fabric.

Funzionalità supportate

Il formato XML è supportato per le seguenti attività e connettori come origine.

Formato XML nell'attività Copy

Per configurare il formato XML, scegliere la connessione nell'origine dell'attività Copy della pipeline di dati e poi selezionare XML nell'elenco a discesa Formato file. Selezionare Impostazioni per configurare ulteriormente questo formato.

Screenshot che mostra le impostazioni del formato dei file.

XML come origine

Dopo aver selezionato Impostazioni nella sezione Formato file, nella finestra di dialogo Impostazioni formato file vengono visualizzate le seguenti proprietà.

Screenshot che mostra la selezione del formato del file.

  • Tipo di compressione: codec di compressione usato per leggere i file XML. Nell’elenco a discesa è possibile scegliere tra i tipi None, bzip2, gzip, deflate, ZipDeflate, TarGzip oppure tar.

    Se si seleziona ZipDeflate come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file ZIP come cartella.

    • Mantenere il nome del file ZIP come cartella: indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia.
      • Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in <specified file path>/<folder named as source zip file>/.
      • Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in <specified file path>. Assicurarsi di non avere nomi di file duplicati in file ZIP di origine diversi per evitare corse o comportamenti imprevisti.

    Se si seleziona TarGzip/tar come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file di compressione come cartella.

    • Mantenere il nome del file di compressione come cartella: indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia.
      • Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in <specified file path>/<folder named as source compressed file>/.
      • Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in <specified file path>. Assicurarsi di non avere nomi di file duplicati in file di origine diversi per evitare corse o comportamenti imprevisti.
  • Livello di compressione: Specificare il rapporto di compressione quando si seleziona un tipo di compressione. È possibile scegliere tra Fastest o Ottimale.

    • Fastest: l'operazione di compressione deve essere completata il più rapidamente possibile, anche se il file risultante non viene compresso in modo ottimale.
    • Optimal: l'operazione di compressione deve comprimere il file in modo ottimale, anche se il completamento richiede più tempo. Per maggiori informazioni, vedere l'argomento relativo al livello di compressione .
  • Codifica: specificare il tipo di codifica utilizzato per scrivere i file di test. Selezionare un tipo dall’elenco a discesa. Il valore predefinito è UTF-8.

  • Valore Null: Specifica la rappresentazione di stringa del valore Null. Il valore predefinito è stringa vuota.

In Impostazioni avanzate nella scheda Origine vengono visualizzate le seguenti proprietà correlate al formato XML.

  • Modalità di convalida: Specifica se convalidare lo schema XML. Selezionare una modalità dall'elenco a discesa.

    • Nessuna: selezionare questa opzione per non usare la modalità di convalida.
    • xsd: selezionare questa opzione per convalidare lo schema XML tramite XSD.
    • dtd: selezionare questa opzione per convalidare lo schema XML tramite DTD.

    Screenshot che mostra le modalità di convalida.

  • Spazi dei nomi: specificare se abilitare lo spazio dei nomi durante l'analisi dei file XML. È selezionato per impostazione predefinita.

  • Abbinare prefissi e spazio dei nomi: se lo spazio dei nomi è abilitato, selezionare + Nuovo e specificare l'URL e il Prefisso. È possibile aggiungere altri abbinamenti selezionando + Nuovo.
    L'URI dello spazio dei nomi per il mapping dei prefissi viene usato per denominare i campi durante l'analisi del file XML. Se uno spazio dei nomi e lo spazio dei nomi di un file XML è abilitato, per impostazione predefinita, il nome del campo corrisponde a quello nel documento XML. Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo è prefix:fieldName.

    Screenshot che mostra le coppie di prefisso dello spazio dei nomi.

  • Rilevare il tipo di dati: Specificare se rilevare i tipi di dati interi, doppi e booleani. È selezionato per impostazione predefinita.

Tabella riepilogativa

XML come origine

Le seguenti proprietà sono supportate nella sezione Origine dell'attività di copia quando si utilizza il formato XML.

Nome Descrizione Valore Richiesti Proprietà script JSON
Formato di file Formato che si desidera usare. XML tipo (in datasetSettings):
XML
Tipo di compressione Codec di compressione usato per leggere file di XML. Nessuno
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
No tipo (in compression):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
Livello di compressione  Rapporto di compressione. Il più rapido
Ottimale 
No livello (in compression):
Il più rapido
Ottimale
Encoding Tipo di codifica usato per leggere file di test. "UTF-8" (predefinito),"UTF-8 senza BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" No encodingName
Mantenere il nome del file ZIP come cartella Indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia. selezionato (impostazione predefinita) o deselezionato No preserveZipFileNameAsFolder
(in compressionProperties->type come ZipDeflateReadSettings):
true (valore predefinito) o false
Mantenere il nome del file di compressione come cartella Indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia. selezionato (impostazione predefinita) o deselezionato No preserveCompressionFileNameAsFolder
(in compressionProperties->type come TarGZipReadSettings o TarReadSettings):
true (valore predefinito) o false
valore NULL Rappresentazione in forma di stringa del valore null. <valore Null>
stringa vuota (impostazione predefinita)
No nullValue
Modalità di convalida Indica se convalidare lo schema XML. Nessuno
xsd
dtd
No validationMode:

xsd
dtd
Namespaces (Spazi dei nomi) Specificare se abilitare lo spazio dei nomi durante l'analisi dei file XML. Sselezionato (impostazione predefinita) o non selezionato No spazi dei nomi:
true (valore predefinito) o false
Coppie prefissi spazio nomi L'URI dello spazio dei nomi per il mapping dei prefissi, che viene usato per denominare i campi durante l'analisi del file XML.
Se uno spazio dei nomi e lo spazio dei nomi di un file XML è abilitato, per impostazione predefinita, il nome del campo corrisponde a quello nel documento XML.
Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo è prefix:fieldName.
< url >:< prefisso > No namespacePrefixes:
< url >:< prefisso >
Rileva tipo di dati Specificare se rilevare i tipi di dati interi, doppi e booleani. Sselezionato (impostazione predefinita) o non selezionato No detectDataType:
true (valore predefinito) o false