Lire des fichiers Parquet à l’aide d’Azure Databricks
Article
Découvrez comment lire des données à partir de fichiers Apache Parquet à l’aide d’Azure Databricks.
Qu’est-ce que Parquet ?
Apache Parquet est un format de fichier en colonnes qui fournit des optimisations pour accélérer les requêtes. Il s’agit d’un format de fichier beaucoup plus efficace que CSV ou JSON.
Faites la démonstration d’une compréhension des tâches d’engineering données courantes pour implémenter et gérer des charges de travail d’engineering données sur Microsoft Azure en utilisant un certain nombre de services Azure.