共用方式為


開始使用 Lakebase 自動縮放

這很重要

Lakebase 自動縮放是 Lakebase 的最新版本,具備自動縮放計算、縮放至零、分支及即時還原功能。 關於支援的區域,請參見 區域可用性。 如果你是 Lakebase Provisioned 使用者,請參見 Lakebase Provisioned

完成本指南後,你會有一個運行中的 Postgres 資料庫,裡面有樣本資料,連接到 Unity Catalog,資料在 Lakebase 和 Databricks 湖屋之間流動。

步驟: (1) 建立專案 → (2) 連接 → (3) 建立資料表 → (4) 註冊 Unity 目錄 → (5) 提供資料

步驟一:建立你的第一個專案

從應用程式切換器開啟 Lakebase 應用程式。

應用程式切換器

選擇 自動縮放 以進入 Lakebase 自動縮放介面。

點擊 新專案。 給你的專案取個名字,然後選擇你的 Postgres 版本。 你的專案是以單一 production 分支、預設 databricks_postgres 資料庫和為該分支配置的計算資源建立的。

建立專案對話框

你的運算可能需要幾秒鐘才能啟動。 分支的運算 production 預設是開啟狀態(縮放至零是關閉的),但如果需要,你可以設定這個設定。

你的專案區域會自動設定為你的工作區區域。

了解更多: 建立專案 | 自動縮放 | 縮放至零

步驟 2:連接您的資料庫

從你的專案中選擇 生產 分支並點擊 連接。 連接字串可與任何標準 Postgres 用戶端psql(pgAdmin、DBeaver 或應用程式框架)相容。

連線對話

要連接你的 Databricks 身份,從連線對話框複製 psql 片段,並在提示時貼上 OAuth 令牌:

psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'

了解更多:連線快速啟動 | psql、pgAdmin | | Postgres 客戶端

步驟三:建立你的第一張表格

Lakebase SQL 編輯器預載了範例 SQL。 從專案中選擇 生產 分支,開啟 SQL 編輯器,執行提供的語句建立 playing_with_lakebase 表格並插入範例資料。

具備預載範例 SQL 的 SQL 編輯器

了解更多: SQL 編輯器 | 表格編輯器 | Postgres 客戶端

步驟 4:在 Unity 目錄註冊

你的 Lakebase 資料庫正在執行,但在你註冊到 Unity Catalog 之前,它對整個 Databricks 平台是看不見的。 註冊後,你可以從 Databricks SQL 查詢 Lakebase 資料表,將營運資料與 lakehouse 分析結合,並套用統一治理。

在目錄檔案總管中,建立一個新的目錄, Lakebase Autoscaling 作為類型,指向你專案的 production 分支和 databricks_postgres 資料庫。

在 Unity 目錄中登錄 LKB 資料庫

你現在可以從 SQL 倉庫查詢:

SELECT * FROM lakebase_catalog.public.playing_with_lakebase;

了解更多: 在 Unity 目錄註冊

步驟五:在你的應用程式中提供 Lakehouse 資料

同步資料表 將 Unity Catalog 的分析數據引入你的 Lakebase 資料庫,使應用程式可以通過低延遲的交易讀取來查詢。 建立一個範例 Unity 目錄資料表,然後同步到 Lakebase。

在 SQL 倉庫或筆記本中,建立一個原始碼資料表:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1001, 'premium', 2500.00, 'high'),
  (1002, 'standard', 450.00, 'medium'),
  (1003, 'premium', 3200.00, 'high'),
  (1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);

現在把這張表格同步到 Lakebase。 在目錄檔案總管中,使用user_segments模式從建立同步的表,目標為你專案的databricks_postgres資料庫。 快照模式只複製一次資料。 若要持續更新,請使用觸發模式或連續模式。

同步完成後,資料會在 Lakebase 中作為default.user_segments_synced提供。 請在 Lakebase SQL 編輯器中查詢:

SELECT * FROM "default".user_segments_synced WHERE engagement = 'high';

備註

default 必須引用,因為它是 PostgreSQL 保留的關鍵字。 同步的資料表結構會繼承 Unity Catalog 的結構名稱,所以如果你的結構被命名 default為 ,查詢時必須一定要引用它。 其他識別碼周圍的引號則是可選的。

在 Lakebase SQL 編輯器中查詢同步的用戶分段

您的湖倉分析現已能基於交易資料庫提供服務。

了解更多: 同步資料表 | 同步模式 | 資料型態映射

後續步驟