Leitura de arquivos Parquet usando o Azure Databricks
Este artigo mostra como ler dados de arquivos do Apache Parquet usando o Azure Databricks.
O que é o Parquet?
O Apache Parquet é um formato de arquivo em coluna com otimizações para acelerar as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.
Para obter mais informações, confira Arquivos Parquet.
Opções
Confira os seguintes artigos de referência sobre o Apache Spark para ver opções de leitura e gravação com suporte.
Exemplo de notebook: ler e gravar em arquivos Parquet
O notebook a seguir mostra como ler e gravar dados em arquivos Parquet.