Leggere i file Parquet con Azure Databricks

Questo articolo illustra come leggere i dati dai file Apache Parquet usando Azure Databricks.

Che cos'è Parquet?

Apache Parquet è un formato di file a colonne con ottimizzazioni che velocizzano le query. Si tratta di un formato di file più efficiente rispetto a CSV o JSON.

Per altre informazioni, vedere File Parquet.

Opzioni

Vedere gli articoli di riferimento di Apache Spark seguenti per le opzioni di lettura e scrittura supportate.

Esempio di notebook: Lettura e scrittura in file Parquet

Il notebook seguente illustra come leggere e scrivere dati in file Parquet.

Lettura del notebook dei file Parquet

Ottenere il notebook