Bagikan melalui


Membaca file Parquet menggunakan Azure Databricks

Artikel ini memperlihatkan kepada Anda cara membaca data dari file Apache Parquet menggunakan Azure Databricks.

Apa itu Parquet?

Apache Parquet adalah format file kolom dengan pengoptimalan yang mempercepat kueri. Ini adalah format file yang lebih efisien daripada CSV atau JSON.

Untuk informasi selengkapnya, lihat File Parquet.

Opsi

Lihat artikel referensi Apache Spark berikut untuk opsi baca dan tulis yang didukung.

Contoh buku catatan: Membaca dan menulis ke file Parquet

Notebook berikut menunjukkan cara membaca dan menulis data ke file Parquet.

Membaca notebook file Parquet

Dapatkan buku catatan