Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penting
Lakebase Autoscaling adalah versi terbaru Lakebase, dengan komputasi penskalaan otomatis, skala-ke-nol, percabangan, dan pemulihan instan. Untuk wilayah yang didukung, lihat Ketersediaan wilayah. Jika Anda adalah pengguna Lakebase Provisioned, lihat Lakebase Provisioned.
Mendaftarkan database Lakebase di Unity Catalog membuat katalog baca-saja yang mewakili database Postgres Anda, memungkinkan tata kelola data terpadu dan analitik lintas sumber di seluruh lakehouse dan beban kerja transaksional Anda.
Mengapa mendaftar di Katalog Unity
Pendaftaran memberikan beberapa manfaat:
Tata kelola terpadu: Terapkan kontrol tata kelola Unity Catalog—izin, pelacakan silsilah data, dan log audit—ke data Lakebase Anda bersama data lakehouse Anda.
Kueri lintas sumber: Mengkueri tabel Unity Catalog dan database Lakebase dari satu antarmuka SQL, memungkinkan analitik yang menggabungkan data transaksional dan analitik.
Penemuan terpusat: Telusuri dan temukan database, skema, dan tabel Lakebase melalui Catalog Explorer bersama sumber data lain di ruang kerja Anda.
Alur kerja terintegrasi: Gunakan data Lakebase di dasbor dan aplikasi Databricks tanpa beralih konteks atau mengelola koneksi terpisah.
Cara kerjanya
Pendaftaran membuat katalog Unity Catalog hanya-baca yang mencerminkan struktur database Postgres Anda, menyediakan akses metadata ke objek-objek dalam database Anda (skema, tabel, tampilan) melalui lapisan manajemen Unity Catalog.
Anda memulai pendaftaran dari Catalog Explorer daripada dari antarmuka Lakebase, yang terintegrasi secara alami dengan alur kerja pembuatan katalog Unity Catalog.
Setelah pendaftaran:
- Database Lakebase Anda muncul sebagai katalog di Katalog Unity
- Izin Katalog Unity mengontrol siapa yang bisa menampilkan dan mengkueri database
- Katalog hanya dapat dibaca—Anda mengelola database sesungguhnya melalui Lakebase
Prasyarat
- Proyek Lakebase yang sudah ada dengan setidaknya satu database
-
CREATE CATALOGhak akses pada metastore Unity Catalog - Gudang SQL tanpa server untuk mengkueri katalog terdaftar
Mendaftarkan database
Antarmuka Pengguna
- Gunakan pengalih aplikasi untuk menavigasi ke Lakehouse.
- Di Catalog Explorer, klik ikon plus dan Buat katalog.
- Masukkan nama katalog (misalnya,
lakebase_catalog). - Pilih Lakebase Postgres sebagai jenis katalog, lalu pilih opsi Autoscaling .
- Pilih database proyek, cabang, dan Postgres Anda.
- Klik Buat.
Katalog muncul di Catalog Explorer, tempat Anda dapat menelusuri skema, tabel, dan tampilan, dan mengkuerinya menggunakan gudang SQL.
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.postgres import Catalog, CatalogCatalogSpec
w = WorkspaceClient()
catalog = w.postgres.create_catalog(
catalog=Catalog(spec=CatalogCatalogSpec(
postgres_database="mydb",
branch="projects/my-project/branches/production",
)),
catalog_id="my-catalog",
).wait()
print(f"Catalog registered: {catalog.name}")
Java SDK
import com.databricks.sdk.WorkspaceClient;
import com.databricks.sdk.service.postgres.*;
WorkspaceClient w = new WorkspaceClient();
Catalog catalog = w.postgres().createCatalog(
new CreateCatalogRequest()
.setCatalogId("my-catalog")
.setCatalog(new Catalog()
.setSpec(new CatalogCatalogSpec()
.setPostgresDatabase("mydb")
.setBranch("projects/my-project/branches/production"))))
.waitForCompletion();
System.out.println("Catalog registered: " + catalog.getName());
melengkung
curl -X POST "https://your-workspace.cloud.databricks.com/api/2.0/postgres/catalogs?catalog_id=my-catalog" \
-H "Authorization: Bearer ${DATABRICKS_TOKEN}" \
-H "Content-Type: application/json" \
-d '{
"spec": {
"postgres_database": "mydb",
"branch": "projects/my-project/branches/production"
}
}'
Ini menghasilkan operasi jangka panjang. Lakukan polling pada bagian yang dikembalikan name hingga done: true. Lihat Operasi jangka panjang. Untuk penyiapan autentikasi, lihat Autentikasi.
Menjelajahi database terdaftar
Setelah pendaftaran, navigasikan ke katalog Anda di Catalog Explorer untuk menelusuri skema, tabel, dan tampilan. Klik tabel apa pun untuk melihat detail skema, data sampel, dan informasi silsilah data.
Katalog Unity secara otomatis menyinkronkan metadata dari database Lakebase Anda. Saat Anda menambahkan atau mengubah tabel di Lakebase, refresh tampilan katalog untuk melihat pembaruan.
Periksa status pendaftaran
Untuk memperoleh detail pendaftaran saat ini untuk katalog secara programatik:
Python SDK
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
catalog = w.postgres.get_catalog("catalogs/my-catalog")
print(f"Database: {catalog.status.postgres_database}")
print(f"Branch: {catalog.status.branch}")
Java SDK
import com.databricks.sdk.WorkspaceClient;
import com.databricks.sdk.service.postgres.Catalog;
WorkspaceClient w = new WorkspaceClient();
Catalog catalog = w.postgres().getCatalog("catalogs/my-catalog");
System.out.println("Database: " + catalog.getStatus().getPostgresDatabase());
System.out.println("Branch: " + catalog.getStatus().getBranch());
melengkung
curl "https://your-workspace.cloud.databricks.com/api/2.0/postgres/catalogs/my-catalog" \
-H "Authorization: Bearer ${DATABRICKS_TOKEN}"
Kueri database yang terdaftar
Kueri database Lakebase terdaftar menggunakan gudang SQL atau alat apa pun yang terhubung ke Unity Catalog:
-- Query a registered :re[LKB] database
SELECT * FROM chatbot_catalog.public.conversations
WHERE created_at >= current_date - INTERVAL 7 DAYS;
-- Join :re[LKB] and lakehouse data
SELECT
c.conversation_id,
c.user_id,
c.agent_response,
u.user_name,
u.subscription_tier
FROM chatbot_catalog.public.conversations c
JOIN main.user_analytics.users u
ON c.user_id = u.user_id;
Katalog baca-saja memastikan kueri tidak mengubah database Lakebase Anda melalui Katalog Unity. Untuk memodifikasi data, gunakan Editor Lakebase SQL atau sambungkan langsung ke database Anda.
Izin dan kontrol akses
Izin Unity Catalog mengontrol akses ke database Lakebase terdaftar:
- Kepemilikan katalog: Pengguna yang mendaftarkan database menjadi pemilik katalog
-
Akses baca: Memberikan
USE CATALOGdanSELECThak istimewa untuk memungkinkan orang lain menggunakan database - Admin metastore: Admin metastore dapat mengelola semua katalog terdaftar
Untuk memberikan akses ke database terdaftar:
-- Grant read access to a group
GRANT USE CATALOG ON CATALOG chatbot_catalog TO `ai-engineering`;
GRANT SELECT ON CATALOG chatbot_catalog TO `ai-engineering`;
Penetapan izin dalam Unity Catalog mengontrol akses kueri ke gudang SQL. Koneksi langsung ke database Lakebase Anda menggunakan peran dan izin Postgres secara independen.
Membatalkan pendaftaran database
Membatalkan pendaftaran menghapus katalog dari Unity Catalog tetapi tidak memengaruhi database Lakebase Anda. Database tetap dapat diakses melalui Lakebase dan koneksi Postgres langsung.
Antarmuka Pengguna
Pilih katalog di Catalog Explorer, klik , dan pilih Hapus.
Python SDK
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
w.postgres.delete_catalog("catalogs/my-catalog").wait()
Java SDK
import com.databricks.sdk.WorkspaceClient;
WorkspaceClient w = new WorkspaceClient();
w.postgres().deleteCatalog("catalogs/my-catalog").waitForCompletion();
melengkung
curl -X DELETE "https://your-workspace.cloud.databricks.com/api/2.0/postgres/catalogs/my-catalog" \
-H "Authorization: Bearer ${DATABRICKS_TOKEN}"
Nota
Jika Anda membuat tabel yang disinkronkan dari database terdaftar, hapus tabel tersebut terlebih dahulu. Setiap tabel sumber hanya dapat digunakan untuk membuat 20 tabel yang disinkronkan, dan tabel yang disinkronkan yang sedang menunggu penghapusan tetap dihitung dalam batas ini.
Keterbatasan
Akses baca-saja: Katalog yang terdaftar dari database Lakebase bersifat baca-saja. Anda tidak dapat mengubah data melalui kueri Katalog Unity.
Database tunggal per katalog: Setiap katalog Katalog Unity mewakili satu database Lakebase. Untuk mengekspos beberapa database, daftarkan masing-masing secara terpisah.
Sinkronisasi metadata: Katalog Unity menyimpan metadata untuk mengurangi permintaan Postgres. Objek baru mungkin tidak segera muncul. Klik
untuk memicu refresh penuh.
Isolasi cabang: Katalog mendata database dari cabang yang ditentukan. Untuk mengakses data dari beberapa cabang, daftarkan database dari setiap cabang sebagai katalog terpisah.