Formati di dati supportati per l'inserimento
Si applica a: ✅Microsoft Fabric✅Azure Esplora dati
L'inserimento dati è il processo in base al quale i dati vengono aggiunti a una tabella e vengono resi disponibili per la query. Per tutti i metodi di inserimento diversi dall'inserimento da query, i dati devono essere in uno dei formati supportati. Nella tabella seguente sono elencati e descritti i formati supportati per l'inserimento dati.
Nota
Prima di inserire i dati, assicurarsi che siano formattati correttamente e definiscano i campi previsti. È consigliabile usare il validator preferito per verificare che il formato sia valido. Ad esempio, i seguenti validator possono essere utili per controllare i file CSV o JSON:
- CSV: http://csvlint.io/
- JSON: https://jsonlint.com/
Per altre informazioni sul motivo per cui l'inserimento potrebbe non riuscire, vedere Errori di inserimento
Formato | Estensione | Descrizione |
---|---|---|
ApacheAvro | .avro |
Formato AVRO con supporto per i tipi logici. Sono supportati i seguenti codec di compressione: null , deflate e snappy . L'implementazione del formato apacheavro del lettore si basa sulla libreria ufficiale di Apache Avro. Per informazioni sull'inserimento di file Avro di acquisizione di Hub eventi, vedere Inserimento di file Avro di acquisizione dell'hub eventi. |
Avro | .avro |
Un'mplementazione legacy per il formato AVRO basata sulla libreria .NET. Sono supportati i seguenti codec di compressione: null , deflate (per snappy usare il formato dati ApacheAvro ). |
CSV | .csv |
File di testo con valori delimitati da virgole (, ). Vedere RFC 4180: Formato comune e tipo MIME per i file con valori delimitati da virgole (CSV). |
JSON | .json |
Un file di testo con oggetti JSON delimitati da \n o \r\n . Vedere Righe JSON (JSONL). |
MultiJSON | .multijson |
File di testo con una matrice JSON di contenitori di proprietà (ognuno dei quali rappresenta un record) o un numero qualsiasi di contenitori di proprietà delimitati da spazi vuoti, \n o \r\n . Ogni contenitore di proprietà può essere distribuito su più righe. |
ORC | .orc |
Un file ORC. |
Parquet | .parquet |
Un file Parquet. |
PSV | .psv |
File di testo con valori delimitati da barre verticali (| ). |
RAW | .raw |
File di testo il cui intero contenuto è un singolo valore stringa. |
SCsv | .scsv |
File di testo con valori delimitati da punti e virgola (; ). |
SOHsv | .sohsv |
File di testo con valori delimitati da SOH. SOH è il punto di codice ASCII 1. Questo formato è usato da Hive in HDInsight. |
TSV | .tsv |
File di testo con valori delimitati da tabulazioni (\t ). |
TSVE | .tsv |
File di testo con valori delimitati da tabulazioni (\t ). Per l'escape viene usato un carattere barra rovesciata (\ ). |
TXT | .txt |
File di testo con righe delimitate da \n . Le righe vuote vengono ignorate. |
W3CLOGFILE | .log |
Formato di file di log Web standardizzato da W3C. |
Nota
- L'inserimento da sistemi di archiviazione dati che forniscono funzionalità ACID sui normali file di formato Parquet (ad esempio Apache Iceberg, Apache Hudi, Delta Lake) non è supportato.
- Avro senza schema non è supportato.
Per altre informazioni sull'inserimento di dati con json
o multijson
formati, vedi Inserire formati JSON.
Formati di compressione dei dati supportati
I BLOB e i file possono essere compressi tramite uno degli algoritmi di compressione seguenti:
Compressione | Estensione |
---|---|
GZip | .gz |
CAP | .zip |
Indicare la compressione aggiungendo l'estensione al nome del BLOB o del file.
Ad esempio:
MyData.csv.zip
indica un BLOB o un file formattato come CSV, compresso con ZIP (archivio o singolo file)MyData.json.gz
indica un BLOB o un file formattato come JSON, compresso con GZip.
Sono supportati anche i nomi di BLOB o file che non includono le estensioni di file ma solo la compressione (ad esempio MyData.zip
). In questo caso, il formato di file deve essere specificato come proprietà di inserimento perché non può essere dedotto.
Nota
- Alcuni formati di compressione tengono traccia dell'estensione di file originale come parte del flusso compresso. Questa estensione viene generalmente ignorata ai fini della determinazione del formato di file. Se non è possibile determinare il formato di file dal nome del file o del BLOB (compresso), deve essere specificato tramite la proprietà di inserimento
format
. - Non confondersi con il codec di compressione (livello di blocco) interno usato dai formati
Parquet
,AVRO
eORC
. Il nome di compressione interno viene in genere aggiunto a un nome file prima dell'estensione del formato di file, ad esempio,file1.gz.parquet
,file1.snappy.avro
e così via. - Il metodo di compressione Deflate64/Enhanced Deflate Zip non è supportato. Si noti che il compressore Zip predefinito di Windows può scegliere di usare questo metodo di compressione su file di dimensioni superiori a 2 GB.
Contenuto correlato
- Altre informazioni sui formati di dati supportati
- Altre informazioni sulle proprietà di inserimento dati
- Altre informazioni sull'inserimento dati