Lire des fichiers Parquet à l’aide d’Azure Databricks

Article
17/12/2024

Découvrez comment lire des données à partir de fichiers Apache Parquet à l’aide d’Azure Databricks.

Qu’est-ce que Parquet ?

Apache Parquet est un format de fichier en colonnes qui fournit des optimisations pour accélérer les requêtes. Il s’agit d’un format de fichier beaucoup plus efficace que CSV ou JSON.

Pour plus d’informations, consultez Fichiers Parquet.

Options

Consultez les articles de référence Apache Spark suivants pour connaître les options de lecture et d’écriture prises en charge.

Lire
- Python
- Scala
Write
- Python
- Scala

Exemple de notebook : Lire et écrire dans des fichiers Parquet

Le notebook suivant montre comment lire et écrire des données dans des fichiers Parquet.

Lecture du notebook des fichiers Parquet

Obtenir le notebook

Partager via