Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Sinkronkan tabel Unity Catalog ke Postgres dan kueri bersama data operasional Anda.
Langkah-langkah: ① Buat data analitik → ② Sinkronkan ke Lakebase → ③ Temukan data Anda di Postgres → ④ Kueri di kedua lingkungan
Note
Ini adalah panduan memulai cepat. Untuk dokumentasi lengkap, lihat Menyinkronkan tabel.
Sebelum Anda mulai
- Pastikan Anda menyelesaikan Dapatkan database Postgres. Anda memerlukan proyek Lakebase dengan data sampel.
- Gudang atau buku catatan SQL untuk kueri Katalog Unity.
- USE_SCHEMA dan CREATE_TABLE pada skema tempat Anda akan membuat tabel yang disinkronkan.
Langkah 1: Membuat data analitik di Unity Catalog
Bayangkan tim data Anda telah membangun skor segmentasi pengguna di lakehouse. Dalam produksi, ini akan menjadi tabel emas, output ML, atau himpunan data yang diperkaya. Untuk panduan ini, Anda akan membuat sampel kecil.
Di gudang atau buku catatan SQL, jalankan:
CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
(1, 'power_user', 0.92),
(2, 'casual', 0.35),
(3, 'power_user', 0.88)
AS segments(user_id, segment, engagement_score);
Perhatikan bahwa nilai user_id sesuai dengan kolom id dalam tabel playing_with_lakebase Anda dari get-started. Itu disengaja. Anda akan bergabung dengan mereka di Langkah 4.
Pelajari selengkapnya: Jenis sumber yang didukung
Langkah 2: Sinkronkan tabel ke Lakebase
Di Catalog Explorer, navigasikan ke tabel Anda user_segments dan buat tabel yang disinkronkan dari tabel tersebut. Pilih database proyek databricks_postgres Lakebase Anda sebagai target dan Rekam Jepret sebagai mode sinkronisasi. Snapshot menyalin data satu kali dan merupakan opsi paling sederhana untuk memulai.
Sinkronisasi berjalan secara otomatis. Saat prosesnya selesai, tabel baru yang hanya-baca muncul di basis data Lakebase Anda. Nama skema dari Unity Catalog menjadi nama skema Postgres, dan nama tabel mendapatkan _synced akhiran: default.user_segments_synced.
Pelajari selengkapnya: Membuat tabel yang disinkronkan (prosedur penuh) | Mode sinkronisasi
Langkah 3: Temukan data Anda di Postgres
Beralih ke Editor Lakebase SQL. Data analitik dari Unity Catalog sekarang dapat dikueri dengan Postgres SQL standar. Cari pengguna 1:
SELECT * FROM "default".user_segments_synced WHERE user_id = 1;
Note
default harus dikutip karena merupakan kata kunci cadangan PostgreSQL. Skema tabel yang disinkronkan mewarisi nama skema Katalog Unity, jadi jika skema Anda diberi nama default, Anda harus selalu mengutipnya dalam kueri.
Anda akan melihat pengguna 1 dengan segmen power_user dan skor keterlibatan 0.92. Ini adalah baris yang sama dengan yang Anda buat di Unity Catalog, sekarang tersedia di Postgres dengan bacaan latensi rendah.
Pelajari lebih lanjut: Pemetaan jenis data
Langkah 4: Lakukan kueri di kedua lingkungan
Ini hasilnya. Tabel Anda playing_with_lakebase memiliki data operasional. tabel Anda user_segments_synced dilengkapi dengan analitik lakehouse. Gabungkan dengan mereka:
SELECT
p.id,
p.name,
p.value,
s.segment,
s.engagement_score
FROM playing_with_lakebase p
JOIN "default".user_segments_synced s ON p.id = s.user_id;
Aplikasi Anda sekarang dapat melayani data yang diperkaya. Satu kueri Postgres menggabungkan apa yang diketahui aplikasi (nama, nilai) dengan apa yang dihitung oleh lakehouse (segmen, skor). Tidak ada panggilan API ke lakehouse, tidak ada skrip sinkronisasi, tidak ada penalti latensi.
Pelajari selengkapnya: Perencanaan kapasitas
Langkah berikutnya
- Pertahankan data tetap segar:Konfigurasikan mode sinkronisasi Terpicu atau Berkelanjutan untuk pembaruan yang sedang berlangsung.
- Buat aplikasi: Gunakan data yang disinkronkan di Aplikasi Databricks atau aplikasi eksternal.
- Jelajahi Lakebase:Konsep inti | Lakebase