Menyajikan data lakehouse

Sinkronkan tabel Unity Catalog ke Postgres dan kueri bersama data operasional Anda.

Langkah-langkah:Buat data analitik → ② Sinkronkan ke Lakebase → ③ Temukan data Anda di Postgres → ④ Kueri di kedua lingkungan

Note

Ini adalah panduan memulai cepat. Untuk dokumentasi lengkap, lihat Menyinkronkan tabel.

Sebelum Anda mulai

  • Pastikan Anda menyelesaikan Dapatkan database Postgres. Anda memerlukan proyek Lakebase dengan data sampel.
  • Gudang atau buku catatan SQL untuk kueri Katalog Unity.
  • USE_SCHEMA dan CREATE_TABLE pada skema tempat Anda akan membuat tabel yang disinkronkan.

Langkah 1: Membuat data analitik di Unity Catalog

Bayangkan tim data Anda telah membangun skor segmentasi pengguna di lakehouse. Dalam produksi, ini akan menjadi tabel emas, output ML, atau himpunan data yang diperkaya. Untuk panduan ini, Anda akan membuat sampel kecil.

Di gudang atau buku catatan SQL, jalankan:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1, 'power_user', 0.92),
  (2, 'casual', 0.35),
  (3, 'power_user', 0.88)
AS segments(user_id, segment, engagement_score);

Perhatikan bahwa nilai user_id sesuai dengan kolom id dalam tabel playing_with_lakebase Anda dari get-started. Itu disengaja. Anda akan bergabung dengan mereka di Langkah 4.

Pelajari selengkapnya: Jenis sumber yang didukung

Langkah 2: Sinkronkan tabel ke Lakebase

Di Catalog Explorer, navigasikan ke tabel Anda user_segments dan buat tabel yang disinkronkan dari tabel tersebut. Pilih database proyek databricks_postgres Lakebase Anda sebagai target dan Rekam Jepret sebagai mode sinkronisasi. Snapshot menyalin data satu kali dan merupakan opsi paling sederhana untuk memulai.

Sinkronisasi berjalan secara otomatis. Saat prosesnya selesai, tabel baru yang hanya-baca muncul di basis data Lakebase Anda. Nama skema dari Unity Catalog menjadi nama skema Postgres, dan nama tabel mendapatkan _synced akhiran: default.user_segments_synced.

Pelajari selengkapnya: Membuat tabel yang disinkronkan (prosedur penuh) | Mode sinkronisasi

Langkah 3: Temukan data Anda di Postgres

Beralih ke Editor Lakebase SQL. Data analitik dari Unity Catalog sekarang dapat dikueri dengan Postgres SQL standar. Cari pengguna 1:

SELECT * FROM "default".user_segments_synced WHERE user_id = 1;

Note

default harus dikutip karena merupakan kata kunci cadangan PostgreSQL. Skema tabel yang disinkronkan mewarisi nama skema Katalog Unity, jadi jika skema Anda diberi nama default, Anda harus selalu mengutipnya dalam kueri.

Anda akan melihat pengguna 1 dengan segmen power_user dan skor keterlibatan 0.92. Ini adalah baris yang sama dengan yang Anda buat di Unity Catalog, sekarang tersedia di Postgres dengan bacaan latensi rendah.

Pelajari lebih lanjut: Pemetaan jenis data

Langkah 4: Lakukan kueri di kedua lingkungan

Ini hasilnya. Tabel Anda playing_with_lakebase memiliki data operasional. tabel Anda user_segments_synced dilengkapi dengan analitik lakehouse. Gabungkan dengan mereka:

SELECT
  p.id,
  p.name,
  p.value,
  s.segment,
  s.engagement_score
FROM playing_with_lakebase p
JOIN "default".user_segments_synced s ON p.id = s.user_id;

Aplikasi Anda sekarang dapat melayani data yang diperkaya. Satu kueri Postgres menggabungkan apa yang diketahui aplikasi (nama, nilai) dengan apa yang dihitung oleh lakehouse (segmen, skor). Tidak ada panggilan API ke lakehouse, tidak ada skrip sinkronisasi, tidak ada penalti latensi.

Pelajari selengkapnya: Perencanaan kapasitas

Langkah berikutnya