Partilhar via


Ler arquivos do Parquet usando o Azure Databricks

Este artigo mostra como ler dados de arquivos Apache Parquet usando o Azure Databricks.

Qual é Parquet?

Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.

Para obter mais informações, consulte Arquivos Parquet.

Opções

Consulte os seguintes artigos de referência do Apache Spark para obter as opções de leitura e gravação suportadas.

Exemplo de bloco de anotações: Ler e gravar em arquivos do Parquet

O bloco de anotações a seguir mostra como ler e gravar dados em arquivos do Parquet.

Leitura de arquivos do Parquet caderno

Obter o bloco de notas