這很重要
Lakebase 自動縮放是 Lakebase 的最新版本,具備自動縮放計算、縮放至零、分支及即時還原功能。 關於支援的區域,請參見 區域可用性。 如果你是 Lakebase Provisioned 使用者,請參見 Lakebase Provisioned。
完成本指南後,你會有一個運行中的 Postgres 資料庫,裡面有樣本資料,連接到 Unity Catalog,資料在 Lakebase 和 Databricks 湖屋之間流動。
步驟: (1) 建立專案 → (2) 連接 → (3) 建立資料表 → (4) 註冊 Unity 目錄 → (5) 提供資料
步驟一:建立你的第一個專案
從應用程式切換器開啟 Lakebase 應用程式。
選擇 自動縮放 以進入 Lakebase 自動縮放介面。
點擊 新專案。 給你的專案取個名字,然後選擇你的 Postgres 版本。 你的專案是以單一 production 分支、預設 databricks_postgres 資料庫和為該分支配置的計算資源建立的。
你的運算可能需要幾秒鐘才能啟動。 分支的運算 production 預設是開啟狀態(縮放至零是關閉的),但如果需要,你可以設定這個設定。
你的專案區域會自動設定為你的工作區區域。
步驟 2:連接您的資料庫
從你的專案中選擇 生產 分支並點擊 連接。 連接字串可與任何標準 Postgres 用戶端psql(pgAdmin、DBeaver 或應用程式框架)相容。
要連接你的 Databricks 身份,從連線對話框複製 psql 片段,並在提示時貼上 OAuth 令牌:
psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'
了解更多:連線快速啟動 | psql、pgAdmin | | Postgres 客戶端
步驟三:建立你的第一張表格
Lakebase SQL 編輯器預載了範例 SQL。 從專案中選擇 生產 分支,開啟 SQL 編輯器,執行提供的語句建立 playing_with_lakebase 表格並插入範例資料。
了解更多: SQL 編輯器 | 表格編輯器 | Postgres 客戶端
步驟 4:在 Unity 目錄註冊
你的 Lakebase 資料庫正在執行,但在你註冊到 Unity Catalog 之前,它對整個 Databricks 平台是看不見的。 註冊後,你可以從 Databricks SQL 查詢 Lakebase 資料表,將營運資料與 lakehouse 分析結合,並套用統一治理。
在目錄檔案總管中,建立一個新的目錄, Lakebase Autoscaling 作為類型,指向你專案的 production 分支和 databricks_postgres 資料庫。
你現在可以從 SQL 倉庫查詢:
SELECT * FROM lakebase_catalog.public.playing_with_lakebase;
了解更多: 在 Unity 目錄註冊
步驟五:在你的應用程式中提供 Lakehouse 資料
同步資料表 將 Unity Catalog 的分析數據引入你的 Lakebase 資料庫,使應用程式可以通過低延遲的交易讀取來查詢。 建立一個範例 Unity 目錄資料表,然後同步到 Lakebase。
在 SQL 倉庫或筆記本中,建立一個原始碼資料表:
CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
(1001, 'premium', 2500.00, 'high'),
(1002, 'standard', 450.00, 'medium'),
(1003, 'premium', 3200.00, 'high'),
(1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);
現在把這張表格同步到 Lakebase。 在目錄檔案總管中,使用user_segments模式從建立同步的表,目標為你專案的databricks_postgres資料庫。 快照模式只複製一次資料。 若要持續更新,請使用觸發模式或連續模式。
同步完成後,資料會在 Lakebase 中作為default.user_segments_synced提供。 請在 Lakebase SQL 編輯器中查詢:
SELECT * FROM "default".user_segments_synced WHERE engagement = 'high';
備註
default 必須引用,因為它是 PostgreSQL 保留的關鍵字。 同步的資料表結構會繼承 Unity Catalog 的結構名稱,所以如果你的結構被命名 default為 ,查詢時必須一定要引用它。 其他識別碼周圍的引號則是可選的。
在 Lakebase SQL 編輯器中查詢同步的用戶分段
您的湖倉分析現已能基於交易資料庫提供服務。
後續步驟
- 建立應用程式:Databricks Apps 教學 | 外部應用程式
- 用分支開發:基於分支的開發教學
- 建立你的團隊:提供專案授權與資料庫存取權
- 探索平台:核心概念 | 專案總覽 | 所有教學