Чтение файлов Parquet с помощью Azure Databricks
В этой статье показано, как считывать данные из файлов Apache Parquet с помощью Azure Databricks.
Что такое Parquet?
Apache Parquet — это формат столбцов с оптимизацией, которая ускоряет запросы. Это более эффективный формат файла, чем CSV или JSON.
Дополнительные сведения см. в разделе "Файлы Parquet".
Параметры
Поддерживаемые параметры чтения и записи см. в следующих справочных статьях об Apache Spark.
Пример записной книжки: чтение и запись в файлы Parquet
В следующей записной книжке показано, как считывать и записывать данные в файлы Parquet.