PostgreSQL 連接器參考

這很重要

Lakeflow Connect 的 PostgreSQL 連接器目前處於公開預覽階段。 請連絡 Databricks 帳戶小組,以註冊公開預覽版。

本頁包含 Databricks Lakeflow Connect 中 PostgreSQL 連接器的參考資料。

自動數據轉換

Databricks 會自動將以下 PostgreSQL 資料型態轉換為相容 Delta 的資料型態:

PostgreSQL 類型 Delta 型
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY STRING
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP STRING
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID BINARY
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

關於日期與時間類型的重要說明

  • DATE 資料型態會被以 Delta DATE 型態來接收。 支援完整的 PostgreSQL 日期範圍。 Inf-Inf 值則轉換為 null。 公元前日期則使用天文年份編號來儲存。 例如,公元前1年對應至0年,2年公元前對應至-1年。
  • TIMESTAMP (無時區)資料型態以字串形式被收錄。 Inf-Inf 值則以字串形式保留。
  • TIMESTAMP WITH TIME ZONE 資料型態會被以 Delta TIMESTAMP 型態來接收。 PostgreSQL 支援的範圍為 4713-01-01 00:00:00.000000 BC294276-12-31 23:59:59.999999 AD,而 Databricks 支援的範圍為 -290308-12-21 BCE 19:59:06 GMT+294247-01-10 CE 04:00:54 GMT。 超過Databrick最大支援時間戳的時間戳會轉換為 null。 公元前日期則使用天文年份編號來儲存。 例如,公元前1年對應至0年,2年公元前對應至-1年。 Inf-Inf 值則轉換為 null
  • TIMETIME WITH TIME ZONE,資料 INTERVAL 型別會以原始格式的字串形式被擷取。 如果需要,你可以使用 Databricks SQL 函式來解析這些字串,轉換成適當的時間表示。 對於 INTERVAL 資料型態,無限大值映射為 0 years 0 mins 0 days 0 hours 0 mins 0.0 secs

使用者定義與第三方資料型態

第三方 PostgreSQL 擴充套件中使用者自訂的型態與資料型態會以字串形式被匯入。 如果你需要轉換這些型別,可以用 Databricks 的 SQL 函式在下游處理中解析字串表示。

複合類型

PostgreSQL 的複合型態(亦稱為列型別)是以字串形式被導入的。 字串表示遵循 PostgreSQL 的複合型態格式: (value1,value2,value3)