Mengelola katalog bawaan

Artikel ini memperkenalkan katalog Unity Catalog default, menjelaskan cara memutuskan katalog mana yang akan digunakan sebagai default, dan menunjukkan cara mengubahnya.

Apa katalog default di Unity Catalog?

Katalog bawaan dikonfigurasi untuk setiap ruang kerja yang diaktifkan menggunakan Unity Catalog. Katalog default memungkinkan Anda melakukan operasi data tanpa menentukan katalog. Jika Anda menghilangkan nama katalog tingkat atas saat Anda melakukan operasi data, katalog default diasumsikan.

Admin ruang kerja dapat melihat atau mengalihkan katalog default menggunakan antarmuka pengguna Pengaturan Admin. Anda juga dapat mengatur katalog default untuk kluster menggunakan konfigurasi Spark.

Pengaturan katalog default ruang kerja hanya berlaku saat menggunakan komputasi yang memenuhi persyaratan komputasi untuk Katalog Unity. Secara khusus, ini berarti Anda menggunakan gudang SQL, atau kluster yang dikonfigurasi dengan mode akses standar atau khusus. Sumber daya komputasi yang tidak kompatibel dengan Unity Catalog menggunakan hive_metastore sebagai katalog default.

Perintah yang tidak menentukan katalog (misalnya GRANT CREATE TABLE ON SCHEMA myschema TO mygroup) dievaluasi untuk katalog dalam urutan berikut:

  1. Apakah katalog diatur untuk sesi menggunakan instruksi USE CATALOG atau pengaturan JDBC?
  2. Apakah konfigurasi Spark spark.databricks.sql.initial.catalog.namespace sudah diatur di kluster?
  3. Apakah ada katalog default ruang kerja yang ditetapkan untuk kluster?

Penting

Konfigurasi pipeline untuk Alur Deklaratif Lakeflow Spark menetapkan katalog default yang menggantikan default ruang kerja.

Konfigurasi katalog default saat Katalog Unity diaktifkan

Katalog default yang awalnya dikonfigurasi untuk ruang kerja Anda bergantung pada bagaimana ruang kerja Anda diaktifkan untuk Katalog Unity:

  • Untuk beberapa ruang kerja yang diaktifkan secara otomatis untuk Katalog Unity, katalog tersebut ditetapkan sebagai katalog bawaan. Lihat Pengaktifan Otomatis Unity Catalog.
  • Untuk semua ruang kerja lainnya, hive_metastore katalog ditetapkan sebagai katalog default.

Saat bermigrasi dari metastore Apache Hive ke Unity Catalog, Anda dapat mengatur katalog default ke hive_metastore untuk menghindari dampak kode yang ada yang mereferensikan metastore Apache Hive.

Pengubahan katalog bawaan

Admin ruang kerja dapat mengubah katalog default untuk ruang kerja. Siapa pun yang memiliki izin untuk membuat atau mengedit sumber daya komputasi dapat mengatur katalog default yang berbeda untuk sumber daya komputasi.

Peringatan

Mengubah katalog default dapat memutus operasi data yang ada yang bergantung padanya.

Untuk mengonfigurasi katalog default yang berbeda untuk ruang kerja:

  1. Masuk ke ruang kerja Anda sebagai admin ruang kerja.
  2. Klik nama pengguna Anda di bilah atas ruang kerja dan pilih Pengaturan Admin dari menu dropdown.
  3. Klik tab Tingkat Lanjut.
  4. Pada baris katalog default untuk ruang kerja, masukkan nama katalog dan klik Simpan.

Mulai ulang gudang dan kluster SQL Anda agar perubahan diterapkan. Semua gudang dan kluster SQL baru dan yang dimulai ulang akan menggunakan katalog ini sebagai default ruang kerja.

Anda juga dapat mengambil alih katalog default untuk kluster tertentu dengan mengatur konfigurasi Spark berikut pada kluster. Pendekatan ini tidak tersedia untuk gudang SQL:

spark.databricks.sql.initial.catalog.namespace

Untuk petunjuknya, lihat Konfigurasi Spark.

Menampilkan katalog default saat ini

Untuk mendapatkan katalog default saat ini untuk ruang kerja Anda, Anda bisa menggunakan pernyataan SQL di buku catatan atau kueri Editor SQL. Admin ruang kerja bisa mendapatkan katalog default menggunakan antarmuka pengguna Pengaturan Admin.

Pengaturan Admin

  1. Masuk ke ruang kerja Anda sebagai admin ruang kerja.
  2. Klik nama pengguna Anda di bilah atas ruang kerja dan pilih Pengaturan Admin dari menu dropdown.
  3. Klik tab Tingkat Lanjut.
  4. Pada baris katalog Default untuk ruang kerja, lihat nama katalog.

SQL

Jalankan perintah berikut dalam buku catatan atau kueri Editor SQL yang berjalan di gudang SQL atau kluster yang mematuhi Katalog Unity. Katalog ruang kerja default akan dikembalikan jika tidak ada pernyataan USE CATALOG atau pengaturan JDBC yang telah diatur pada sesi, dan jika tidak ada konfigurasi spark.databricks.sql.initial.catalog.namespace yang diatur untuk kluster.

SELECT current_catalog();

Menghapus katalog ruang kerja

Untuk ruang kerja dengan Unity Catalog diaktifkan secara default, katalog ruang kerja dipertahankan bahkan setelah Anda menghapus ruang kerja. Ini mempertahankan data Anda. Jika Anda ingin menghapus sepenuhnya katalog ruang kerja dan semua data terkait, Anda dapat menggunakan metode penghapusan paksa saat menghapus ruang kerja. Untuk detailnya, lihat Menghapus paksa katalog ruang kerja.