Condividi tramite


Formato ORC in Data Factory in Microsoft Fabric

Questo articolo illustra come configurare il formato ORC nella pipeline di dati di Data Factory in Microsoft Fabric.

Funzionalità supportate

Il formato ORC è supportato per le attività e i connettori seguenti come origine e destinazione.

Categoria Connettore/attività
Connettore supportato Amazon S3
Compatibile con Amazon S3
Archiviazione BLOB di Azure
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
File di Azure
File system
FTP
Google Cloud Storage
HTTP
File Lakehouse
Oracle Cloud Storage
SFTP
Attività supportata attività Copy (origine/destinazione)
Attività Lookup
Attività GetMetadata
Attività Elimina dati

Formato ORC nell'attività di copia

Per configurare il formato ORC, scegliere la connessione nell'origine o nella destinazione dell'attività di copia della pipeline di dati e quindi selezionare ORC nell'elenco a discesa Formato file. Selezionare Impostazioni per un'ulteriore configurazione di questo formato.

Screenshot che mostra le impostazioni del formato di file.

Formato ORC come origine

Dopo aver selezionato Impostazioni nella sezione Formato file, vengono visualizzate le proprietà seguenti nella finestra di dialogo Impostazioni formato file popup.

Screenshot che mostra l'origine del formato di file ORC.

  • Tipo di compressione: scegliere il codec di compressione usato per leggere i file ORC nell'elenco a discesa. È possibile scegliere tra Nessuno, zlib o snappy.

Formato ORC come destinazione

Dopo aver selezionato Impostazioni, vengono visualizzate le proprietà seguenti nella finestra di dialogo Impostazioni formato file popup.

Screenshot che mostra la destinazione del formato di file ORC.

  • Tipo di compressione: scegliere il codec di compressione usato per scrivere file ORC nell'elenco a discesa. È possibile scegliere tra Nessuno, zlib o snappy.

In Impostazioni avanzate nella scheda Destinazione vengono visualizzate le proprietà correlate al formato ORC seguenti.

  • Numero massimo di righe per file: quando si scrivono dati in una cartella, è possibile scegliere di scrivere in più file e specificare le righe massime per ogni file. Specificare le righe massime da scrivere per ogni file.
  • Prefisso del nome file: applicabile quando è configurato il numero massimo di righe per file. Specificare il prefisso del nome file durante la scrittura di dati in più file, con questo modello: <fileNamePrefix>_00000.<fileExtension>. Se non specificato, il prefisso del nome file viene generato automaticamente. Questa proprietà non si applica quando l'origine è un archivio basato su file o un'opzione di partizione abilitata per l'archivio dati.

Riepilogo tabella

ORC come origine

Le proprietà seguenti sono supportate nella sezione Origine dell'attività di copia quando si usa il formato ORC.

Nome Descrizione Valore Richiesto Proprietà script JSON
Formato file Formato di file che si desidera utilizzare. ORC type (in datasetSettings):
Orco
Tipo di compressione Codec di compressione usato per leggere i file ORC. Nessuno
zlib
Scattanti
No orcCompressionCodec:
Nessuno
zlib
snappy

ORC come destinazione

Le proprietà seguenti sono supportate nella sezione Destinazione attività di copia quando si usa il formato ORC.

Nome Descrizione Valore Richiesto Proprietà script JSON
Formato file Formato di file che si desidera utilizzare. ORC type (in datasetSettings):
Orco
Tipo di compressione Codec di compressione usato per scrivere file ORC. Nessuno
zlib
Scattanti
No orcCompressionCodec:
Nessuno
zlib
snappy
Numero massimo di righe per file Quando si scrivono dati in una cartella, è possibile scegliere di scrivere in più file e specificare le righe massime per ogni file. Specificare le righe massime da scrivere per ogni file. <numero massimo di righe per file> No maxRowsPerFile
Prefisso del nome file Applicabile quando è configurato il numero massimo di righe per file . Specificare il prefisso del nome file durante la scrittura di dati in più file, con questo modello: <fileNamePrefix>_00000.<fileExtension>. Se non specificato, il prefisso del nome file viene generato automaticamente. Questa proprietà non si applica quando l'origine è un archivio basato su file o un'opzione di partizione abilitata per l'archivio dati. <prefisso del nome file> No fileNamePrefix