Membaca file Parquet menggunakan Azure Databricks
Artikel ini memperlihatkan kepada Anda cara membaca data dari file Apache Parquet menggunakan Azure Databricks.
Apa itu Parquet?
Apache Parquet adalah format file kolom dengan pengoptimalan yang mempercepat kueri. Ini adalah format file yang lebih efisien daripada CSV atau JSON.
Untuk informasi selengkapnya, lihat File Parquet.
Opsi
Lihat artikel referensi Apache Spark berikut untuk opsi baca dan tulis yang didukung.
Contoh buku catatan: Membaca dan menulis ke file Parquet
Notebook berikut menunjukkan cara membaca dan menulis data ke file Parquet.