Göl evi verilerini sunma

Unity Kataloğu tablosunu Postgres ile eşitleyin ve işletimsel verilerinizle birlikte sorgulayın.

Adımlar: (1) Analiz verileri oluşturma → (2) Lakebase ile eşitleme → (3) Postgres'te verilerinizi bulma → (4) Her iki dünyada da sorgulama

Note

Bu hızlı bir başlangıçtır. Tüm belgeler için bkz. Tabloları eşitleme.

Başlamadan önce

  • Postgres veritabanı alma'nın tamamlandığından emin olun. Örnek verileri içeren bir Lakebase projesine ihtiyacınız vardır.
  • Unity Kataloğu sorguları için bir SQL ambarı veya not defteri.
  • USE_SCHEMA ve CREATE_TABLE izinlerine, senkronize tabloyu oluşturacağınız şemada sahip olmanız gerekir.

1. Adım: Unity Kataloğu'nda analiz verileri oluşturma

Veri ekibinizin lakehouse'ta kullanıcı segmentasyon puanları oluşturduğunu düşünün. Üretimde bu altın renkli bir tablo, ML çıkışı veya zenginleştirilmiş veri kümesi olabilir. Bu kılavuz için küçük bir örnek oluşturacaksınız.

SQL ambarında veya not defterinde şunu çalıştırın:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1, 'power_user', 0.92),
  (2, 'casual', 0.35),
  (3, 'power_user', 0.88)
AS segments(user_id, segment, engagement_score);

user_id değerlerinin, get-started’daki playing_with_lakebase tablonuzdaki id sütunuyla eşleştiğine dikkat edin. Bu kasıtlı bir şey. 4. Adımda bunlara katılacaksınız.

Daha fazla bilgi edinin: Desteklenen kaynak türleri

2. Adım: Tabloyu Lakebase ile eşitleme

Katalog Gezgini'nde tablonuza user_segments gidin ve bundan eşitlenmiş bir tablo oluşturun. Hedef olarak Lakebase projenizin databricks_postgres veritabanını ve eşitleme modu olarak Snapshot'ı seçin. Anlık görüntü, başlangıç için en basit seçenek olan verileri bir kez kopyalar.

Eşitleme otomatik olarak çalışır. Tamamlandığında Lakebase veritabanınızda yeni bir salt okunur tablo görüntülenir. Unity Catalog’daki şema adı, Postgres şema adına dönüşür ve tablo adına _synced son eki eklenir: default.user_segments_synced.

Daha fazla bilgi edinin: Eşitlenmiş tablo oluşturma (tam yordam) | Eşitleme modları

3. Adım: Postgres'te verilerinizi bulma

Lakebase SQL Düzenleyicisi'ne geçin. Unity Kataloğu'ndan alınan analiz verileri artık standart Postgres SQL ile sorgulanabilir. Kullanıcı 1arayın:

SELECT * FROM "default".user_segments_synced WHERE user_id = 1;

Note

default PostgreSQL ayrılmış anahtar sözcüğü olduğundan tırnak içine alınmalıdır. Senkronize edilen tablo şeması, Unity Catalog şema adını devralır; bu nedenle, şemanızın adı default ise, onu sorgularda her zaman tırnak içinde yazmalısınız.

1 kullanıcısını, power_user segmenti ve 0.92 etkileşim puanıyla görmeniz gerekir. Bu, Unity Kataloğu'nda oluşturduğunuz satırla aynıdır ve artık Postgres'te düşük gecikme süreli okumalarla kullanılabilir.

Daha fazla bilgi edinin: Veri türü eşlemesi

4. Adım: Her iki dünyada da sorgulama

İşte ödeme. playing_with_lakebase tablonuzda operasyonel veriler var. user_segments_synced tablonuz lakehouse analitiği sunar. Bunlara katılın:

SELECT
  p.id,
  p.name,
  p.value,
  s.segment,
  s.engagement_score
FROM playing_with_lakebase p
JOIN "default".user_segments_synced s ON p.id = s.user_id;

Uygulamanız artık zenginleştirilmiş verilere hizmet verebilir. Tek bir Postgres sorgusu, uygulamanın bildiklerini (adlar, değerler) lakehouse'un hesaplamış olduğu (segmentler, puanlar) ile birleştirir. Lakehouse’a API çağrısı yok, eşitleme betikleri yok, gecikme cezası yok.

Daha fazla bilgi edinin: Kapasite planlaması

Sonraki Adımlar