Bagikan melalui


Tabel dan tampilan di Azure Databricks

Artikel ini memberikan gambaran umum tentang tabel, tampilan, tabel streaming, dan tampilan materialisasi di Azure Databricks.

Meja

Tabel adalah himpunan data terstruktur yang disimpan di lokasi tertentu. Jenis tabel default yang dibuat di Azure Databricks adalah tabel terkelola Unity Catalog. Tabel dapat dikueri dan dimanipulasi menggunakan perintah SQL atau API DataFrame, operasi pendukung seperti INSERT, , UPDATEDELETE, dan MERGE INTO. Lihat tabel Azure Databricks

Tampilkan

Tampilan adalah tabel virtual yang ditentukan oleh kueri yang tidak menyimpan data dan dapat menyajikan data dari satu atau beberapa tabel dalam format atau abstraksi tertentu. Tampilan berguna untuk menyederhanakan kueri kompleks, merangkum logika bisnis, dan menyediakan antarmuka yang konsisten ke data yang mendasarinya tanpa menduplikasi penyimpanan. Lihat Apa itu tampilan?

Tampilan Terwujud

Mirip dengan tampilan, tampilan materialisasi ditentukan oleh kueri. Namun, tidak seperti tampilan, tampilan materialisasi melakukan prakompeksi dan menyimpan hasil kueri. Kueri dapat beroperasi lebih cepat terhadap tampilan materialisasi daripada view, tetapi membutuhkan penyimpanan tambahan. Anda dapat menggunakan Databricks SQL untuk membuat dan menyegarkan tampilan materialisasi mandiri atau menggunakan Alur Deklaratif Lakeflow Spark untuk membuat dan me-refresh satu atau beberapa tampilan materialisasi, tabel streaming, dan tampilan. Lihat Gunakan tampilan terwujud di Databricks SQL dan Tampilan Terwujud.

Tabel streaming

Tabel streaming adalah jenis tabel terkelola Unity Catalog yang menyertakan logika pemrosesan menggunakan alur untuk menentukannya. Anda dapat menggunakan Databricks SQL untuk membuat dan me-refresh tabel streaming mandiri atau menggunakan Alur Deklaratif Lakeflow Spark untuk membuat dan me-refresh satu atau beberapa tabel streaming, tampilan materialisasi, dan tampilan. Lihat Gunakan tabel streaming di Databricks SQL dan Tabel Streaming.

Tampilan materialisasi vs. tabel streaming

Tampilan materialisasi dan tabel streaming adalah dua objek data umum yang digunakan untuk rekayasa data. Tampilan materialisasi memakai semantik batch, sedangkan tabel streaming memakai semantik streaming. Untuk perbandingan antara batch dan streaming, dan pertimbangan untuk memilihnya untuk beban kerja rekayasa data Anda, lihat Batch vs. pemrosesan data streaming di Azure Databricks.