Bagikan melalui


Apa itu pandangan?

Tampilan adalah objek baca-saja yang merupakan hasil kueri atas satu atau beberapa tabel dan tampilan dalam metastore Katalog Unity. Anda dapat membuat tampilan dari tabel dan dari tampilan lain dalam beberapa skema dan katalog.

Artikel ini menjelaskan tampilan yang bisa Anda buat di Azure Databricks dan memberikan penjelasan tentang izin dan komputasi yang diperlukan untuk mengkuerinya.

Untuk informasi tentang membuat view, lihat:

Tampilan di Katalog Unity

Di Unity Catalog, tampilan berada di tingkat ketiga namespace tiga tingkat (catalog.schema.view):

Diagram model objek Katalog Unity, berfokus pada tampilan

Tampilan menyimpan teks kueri biasanya terhadap satu atau beberapa sumber data atau tabel di metastore. Di Azure Databricks, tampilan setara dengan Spark DataFrame yang bertahan sebagai objek dalam skema. Tidak seperti DataFrames, Anda dapat mengkueri tampilan dari mana saja di Azure Databricks, dengan asumsi Bahwa Anda memiliki izin untuk melakukannya. Membuat tampilan tidak memproses atau menulis data apa pun. Hanya teks kueri yang didaftarkan ke metastore dalam skema terkait.

Catatan

Tampilan mungkin memiliki semantik eksekusi yang berbeda jika didukung oleh sumber data selain tabel Delta. Databricks merekomendasikan agar Anda selalu menentukan tampilan dengan mereferensikan sumber data menggunakan tabel atau nama tampilan. Menentukan tampilan terhadap himpunan data dengan menentukan jalur atau URI dapat menyebabkan persyaratan tata kelola data yang membingungkan.

Penayangan metrik

Tampilan metrik di Unity Catalog menentukan metrik bisnis yang dapat digunakan kembali yang dikelola secara terpusat dan dapat diakses oleh semua pengguna di ruang kerja Anda. Tampilan metrik mengabstraksi logika di balik KPI yang umum digunakan—seperti pendapatan, jumlah pelanggan, atau tingkat konversi—sehingga dapat secara konsisten dikueri di seluruh dasbor, buku catatan, dan laporan. Setiap tampilan metrik menentukan serangkaian pengukuran dan dimensi berdasarkan tabel sumber, tampilan, atau kueri SQL. Tampilan metrik ditentukan dalam YAML dan dikueri menggunakan SQL.

Menggunakan tampilan metrik membantu mengurangi inkonsistensi dalam definisi metrik yang mungkin diduplikasi di beberapa alat dan alur kerja. Lihat Tampilan metrik untuk mempelajari selengkapnya.

Pandangan materialisasi

Tampilan material secara bertahap menghitung dan memperbarui hasil yang dikembalikan oleh kueri definisi. Tampilan yang sudah dimaterialisasi di Azure Databricks adalah jenis tabel Delta khusus. Sedangkan semua tampilan lain di Azure Databricks menghitung hasil dengan mengevaluasi logika yang menentukan tampilan saat dikueri, tampilan termaterialisasi memproses hasil dan menyimpannya dalam tabel yang mendasari saat pembaruan diproses menggunakan jadwal penyegaran atau menjalankan pembaruan alur.

Anda dapat mendaftarkan tampilan materialisasi di Unity Catalog menggunakan Databricks SQL atau mendefinisikannya sebagai bagian dari Alur Deklaratif Lakeflow Spark. Lihat Menggunakan tampilan materialisasi di Databricks SQL dan Lakeflow Spark Declarative Pipelines.

Tampilan sementara

Tampilan sementara memiliki cakupan dan persistensi terbatas dan tidak terdaftar ke skema atau katalog. Masa pakai tampilan sementara berbeda berdasarkan lingkungan yang Anda gunakan:

  • Di buku catatan dan pekerjaan, tampilan sementara dibatasi pada tingkat buku catatan atau skrip. Elemen-elemen tersebut tidak dapat direferensikan di luar buku catatan tempat mereka dideklarasikan, dan tidak lagi ada ketika buku catatan terlepas dari kluster.
  • Di Databricks SQL, tampilan-tampilan sementara dibatasi pada tingkat kueri. Beberapa pernyataan dalam kueri yang sama dapat menggunakan tampilan sementara, tetapi tidak dapat direferensikan dalam kueri lain, bahkan dalam dasbor yang sama.

Tampilan dinamis

Tampilan dinamis dapat digunakan untuk menyediakan kontrol akses tingkat baris dan kolom, selain masking data. Lihat Membuat tampilan dinamis.

Tampilan di metastore Hive (versi lama)

Anda dapat menentukan tampilan Apache Hive warisan terhadap sumber data apa pun dan mendaftarkannya di metastore Apache Hive warisan. Databricks merekomendasikan migrasi semua tampilan Apache Hive warisan ke Unity Catalog. Lihat Views di Hive metastore.

Tampilan sementara global Apache Hive (warisan)

Tampilan sementara global adalah fitur Azure Databricks warisan yang memungkinkan Anda mendaftarkan tampilan sementara yang tersedia untuk semua beban kerja yang berjalan terhadap sumber daya komputasi. Tampilan sementara global adalah sisa peninggalan dari Apache Hive dan HDFS. Databricks menyarankan agar tidak menggunakan tampilan sementara global.

Persyaratan untuk melakukan kueri pada tampilan

Untuk membaca tampilan yang terdaftar di Unity Catalog, izin yang diperlukan bergantung pada jenis komputasi, versi Databricks Runtime, dan mode akses.

Catatan

Untuk semua tampilan, pemeriksaan izin dilakukan pada tampilan itu sendiri serta pada tabel dan tampilan yang menjadi dasar pembangunan tampilan tersebut. Pengguna yang izinnya diperiksa untuk tabel dan tampilan dasar tergantung pada komputasi. Untuk hal-hal berikut, Unity Catalog memeriksa izin pemilik tampilan pada data dasar.

  • Gudang SQL.
  • Komputasi standar (sebelumnya komputasi bersama).
  • Komputasi khusus (sebelumnya komputasi pengguna tunggal) pada Databricks Runtime 15.4 LTS ke atas dengan kontrol akses tingkat lanjut yang diaktifkan.

Untuk komputasi khusus pada Databricks Runtime 15.3 ke bawah, Unity Catalog memeriksa izin pemilik pandangan dan izin pengguna pandangan pada data yang mendasarinya.

Perilaku ini tercermin dalam persyaratan yang tercantum di bawah ini. Dalam kedua kasus, pemilik tampilan harus mempertahankan izin pada data yang mendasar agar pengguna dapat mengakses tampilan.

  • Untuk semua sumber daya komputasi, Anda harus memiliki SELECT pada tampilan itu sendiri, USE CATALOG pada katalog induknya, dan USE SCHEMA pada skema induknya. Ini berlaku untuk semua jenis komputasi yang mendukung Unity Catalog, termasuk gudang SQL, kluster dalam mode akses standar, dan kluster dalam mode akses khusus pada Databricks Runtime 15.4 ke atas.
  • Untuk klaster pada Databricks Runtime 15.3 dan versi sebelumnya yang menggunakan mode akses khusus, Anda juga harus memiliki SELECT pada semua tabel dan tampilan yang disebutkan oleh tampilan tersebut, selain USE CATALOG pada katalog induknya dan USE SCHEMA pada skema induknya.

Catatan

Jika Anda menggunakan kluster khusus pada Databricks Runtime 15.4 LTS ke atas dan Anda ingin menghindari persyaratan untuk memiliki SELECT pada tabel dan tampilan yang mendasarinya, verifikasi bahwa ruang kerja Anda diaktifkan untuk komputasi tanpa server.

Komputasi tanpa server menangani pemfilteran data, yang memungkinkan akses ke suatu tampilan tanpa memerlukan izin pada tabel dan tampilan yang menjadi dasarnya. Ketahuilah bahwa Anda mungkin dikenakan biaya komputasi tanpa server saat Anda menggunakan komputasi khusus untuk tampilan kueri. Untuk informasi selengkapnya, lihat Kontrol akses terperindar pada komputasi khusus.