Megosztás:


A Lakebase Postgres használatának első lépései

Fontos

A Lakebase automatikus skálázása bétaverzióban érhető el a következő régiókban: eastus2, , westeuropewestus.

A Lakebase Autoscaling a Lakebase legújabb verziója automatikus skálázási számítással, nullára skálázással, elágaztatással és azonnali visszaállítással. A Lakebase Provisioned szolgáltatással való összehasonlításához tekintse meg a verziók közötti választást.

Percek alatt megismerkedhet a Lakebase Postgres szolgáltatással. Hozza létre az első projektet, csatlakozzon az adatbázishoz, és fedezze fel a Unity Catalog integrációját is magában foglaló főbb funkciókat.

Az első projekt létrehozása

Nyissa meg a Lakebase alkalmazást az alkalmazásváltóból.

Alkalmazások kapcsolója

Válassza az Automatikus skálázás lehetőséget a Lakebase automatikus skálázási felhasználói felületének eléréséhez.

Kattintson az Új projekt gombra. Adjon nevet a projektnek, és válassza ki a Postgres-verziót. A projekt egyetlen production ággal, alapértelmezett databricks_postgres adatbázissal és az ághoz konfigurált számítási erőforrásokkal jön létre.

Párbeszédpanel a projekt létrehozásához

A számítógép bekapcsolása eltarthat néhány pillanatig. Az ág számítása production alapértelmezés szerint mindig be van kapcsolva (a skálázás a nullára le van tiltva), de szükség esetén konfigurálhatja ezt a beállítást.

A projekt régiója automatikusan a munkaterület régiójára van állítva. A részletes konfigurációs beállításokért lásd: Projekt létrehozása.

Csatlakozás az adatbázishoz

A projektben válassza ki az éles ágat, és kattintson a Csatlakozás gombra. A Databricks-identitással OAuth-hitelesítéssel csatlakozhat, vagy létrehozhat natív Postgres-jelszószerepkört. A kapcsolati sztringek olyan szabványos Postgres-ügyfelekkel működnek, mint a psqlpgAdmin vagy bármely Postgres-kompatibilis eszköz.

Csatlakozás ablak

Projekt létrehozásakor automatikusan létrejön egy Postgres-szerepkör a Databricks-identitáshoz (például user@databricks.com) . Ez a szerepkör az alapértelmezett databricks_postgres adatbázis tulajdonosa, és tagja databricks_superuser, és széles körű jogosultságokat biztosít az adatbázis-objektumok kezeléséhez.

Ha a Databricks-identitással szeretne csatlakozni az OAuth-hoz, másolja a psql kapcsolatrészletet a kapcsolati párbeszédpanelről.

psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'

Miután beírja a psql kapcsolódási parancsot a terminálban, a rendszer kérni fogja, hogy adjon meg egy OAuth-jogkivonatot. A jogkivonat lekéréséhez kattintson az OAuth-jogkivonat másolása lehetőségre a kapcsolati párbeszédpanelen.

A kapcsolat részleteiről és a hitelesítési lehetőségekről a rövid útmutatóban olvashat.

Az első tábla létrehozása

A Lakebase SQL-szerkesztő előre be van töltve sql-mintaként az első lépésekhez. A saját projektjéből válassza ki a produkciós ágat, nyissa meg az SQL-szerkesztőt, és futtassa a megadott utasításokat, hogy létrehozzon egy playing_with_lakebase táblát és beszúrjon mintaadatokat. A Táblák szerkesztője vizualizációs adatkezelésre is használható, vagy külső Postgres-ügyfelekkel is csatlakozhat.

SQL-szerkesztő előre betöltött SQL-mintával

További információ a lekérdezési lehetőségekről: SQL Editor | Tables Editor | Postgres-ügyfelek

Regisztráció a Unity Katalógusban

Most, hogy létrehozott egy táblát az éles ágon, regisztráljuk az adatbázist a Unity Catalogban, hogy lekérdezhesse az adatokat a Databricks SQL-szerkesztőből.

  1. Az alkalmazásváltóval navigálhat a Lakehouse-ba.
  2. A Katalóguskezelőben kattintson a plusz ikonra, és hozzon létre egy katalógust.
  3. Adja meg a katalógus nevét (például lakebase_catalog).
  4. Katalógustípusként válassza a Lakebase Postgres lehetőséget, és engedélyezze az automatikus méretezési lehetőséget.
  5. Válassza ki a projektet, az production ágat és az adatbázist databricks_postgres .
  6. Kattintson a Létrehozás gombra.

LKB-adatbázis regisztrálása a Unity Katalógusban

Most már lekérdezheti az imént létrehozott táblát a playing_with_lakebase Databricks SQL Editorból egy SQL Warehouse használatával:

SELECT * FROM lakebase_catalog.public.playing_with_lakebase;

Ez lehetővé teszi az összevont lekérdezéseket, amelyek lakehouse-elemzéssel csatlakoztatják a Lakebase tranzakciós adatait. További részletekért lásd: Regisztráció a Unity Katalógusban.

Adatok szinkronizálása fordított ETL-vel

Most látta, hogyan teheti lekérdezhetővé a Lakebase-adatokat a Unity Catalogban. A Lakebase fordított irányban is működik: a unity katalógusból származó válogatott elemzési adatokat a Lakebase-adatbázisba hozza. Ez akkor hasznos, ha gazdagított adatokat, ml-funkciókat vagy a lakehouse-ban kiszámított összesített metrikákat tartalmaz, amelyeket alacsony késésű tranzakciós lekérdezésekkel rendelkező alkalmazásoknak kell kiszolgálnia.

Először hozzon létre egy táblázatot a Unity Katalógusban, amely az elemzési adatokat jelöli. Nyisson meg egy SQL-raktárat vagy jegyzetfüzetet, és futtassa a következőt:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1001, 'premium', 2500.00, 'high'),
  (1002, 'standard', 450.00, 'medium'),
  (1003, 'premium', 3200.00, 'high'),
  (1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);

Most szinkronizálja ezt a táblát a Lakebase-adatbázissal:

  1. A Lakehouse Catalog Explorerben lépjen a >alapértelmezett>user_segments.
  2. Kattintson aSzinkronizált tábla> gombra.
  3. Konfigurálja a szinkronizálást:
    • Tábla neve: Adjon meg egy user_segments_synced.
    • Adatbázis típusa: Válassza a Lakebase Kiszolgáló nélküli (Automatikus skálázás) lehetőséget.
    • Szinkronizálási mód: Pillanatkép kiválasztása egyszeri adatszinkronizáláshoz.
    • Válassza ki a projektet, a gyártás ágat, és az databricks_postgres adatbázist.
  4. Kattintson a Létrehozás gombra.

A szinkronizálás befejezése után a tábla megjelenik a Lakebase-adatbázisban. A szinkronizálási folyamat létrehoz egy sémát default a Postgresben, amely megfelel a Unity Catalog sémájának, így main.default.user_segments_synced válik .default.user_segments_synced Lépjen vissza a Lakebase-be az alkalmazásváltóval, és kérdezze le a Lakebase SQL-szerkesztőben:

SELECT * FROM "default"."user_segments_synced" WHERE "engagement" = 'high';

Szinkronizált felhasználói szegmensek lekérdezése a Lakebase SQL-szerkesztőben

A lakehouse-elemzések mostantól valós idejű kiszolgálásra is elérhetők a tranzakciós adatbázisban. A folyamatos szinkronizálásról, a speciális konfigurációkról és az adattípus-leképezésekről lásd: Fordított ETL.

Következő lépések

Oktatóanyagok

Csatlakozz

Legfontosabb funkciók

További információk