Condividi tramite


Informazioni di riferimento sul connettore PostgreSQL

Importante

Il connettore PostgreSQL per Lakeflow Connect è disponibile in anteprima pubblica. Contatta il team dell'account Databricks per iscriversi all'anteprima pubblica.

Questa pagina contiene materiale di riferimento per il connettore PostgreSQL in Databricks Lakeflow Connect.

Trasformazioni automatiche dei dati

Databricks trasforma automaticamente i tipi di dati PostgreSQL seguenti in tipi di dati compatibili con Delta:

Tipo PostgreSQL Tipo delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Note importanti sui tipi di data e ora

  • DATE le colonne vengono inserite come tipo Delta DATE .
  • TIMESTAMP e TIMESTAMP WITH TIME ZONE colonne sono ingerite come tipo Delta TIMESTAMP. Per TIMESTAMP WITH TIME ZONE, le informazioni sul fuso orario sono mantenute durante l'inserimento.
  • TIMELe colonne , TIME WITH TIME ZONEe INTERVAL vengono inserite come stringhe nel formato originale. È possibile usare le funzioni SQL di Databricks per analizzare queste stringhe nelle rappresentazioni temporali appropriate, se necessario.

Tipi di dati definiti dall'utente e di terze parti

I tipi definiti dall'utente e i tipi di dati delle estensioni PostgreSQL di terze parti vengono inseriti come stringhe. Se è necessario trasformare questi tipi, è possibile usare le funzioni SQL di Databricks per analizzare le rappresentazioni di stringa nell'elaborazione downstream.

Tipi compositi

I tipi compositi PostgreSQL (noti anche come tipi di riga) vengono inseriti come stringhe. La rappresentazione di stringa segue il formato di tipo composito di PostgreSQL: (value1,value2,value3).