Sdílet prostřednictvím


Začínáme s Lakebase Postgres

Důležité

Automatické škálování LakeBase je v beta verzích v následujících oblastech: eastus2, westeurope, westus.

Automatické škálování LakeBase je nejnovější verze LakeBase s automatickým škálováním výpočetních prostředků, škálováním na nulu, větvení a okamžitým obnovením. Porovnání funkcí se službou Lakebase Provisioned najdete v tématu Volba mezi verzemi.

Začněte používat Lakebase Postgres během několika minut. Vytvořte svůj první projekt, připojte se k databázi a prozkoumejte klíčové funkce, včetně integrace katalogu Unity.

Vytvoření prvního projektu

Otevřete aplikaci Lakebase z přepínače aplikací.

Přepínač aplikací

Pokud chcete získat přístup k uživatelskému rozhraní automatického škálování LakeBase, vyberte automatické škálování .

Klikněte na Nový projekt. Pojmenujte projekt a vyberte verzi Postgres. Projekt se vytvoří s jednou production větví, výchozí databricks_postgres databází a výpočetními prostředky nakonfigurovanými pro větev.

Dialogové okno Vytvořit projekt

Aktivace vašeho počítače může trvat několik momentů. Výpočty pro production větev jsou ve výchozím nastavení vždy zapnuté (škálování na nulu je zakázané), ale v případě potřeby můžete toto nastavení nakonfigurovat.

Oblast projektu se automaticky nastaví na vaši oblast pracovního prostoru. Podrobné možnosti konfigurace najdete v tématu Vytvoření projektu.

Připojení k databázi

V projektu vyberte produkční větev a klikněte na Připojit. Můžete se připojit pomocí identity Databricks s ověřováním OAuth nebo vytvořit nativní roli hesla Postgres. Připojovací řetězce pracují se standardními klienty Postgres, jako jsou psql, pgAdmin nebo jakýkoli nástroj kompatibilní s Postgres.

Připojit dialog

Při vytváření projektu se automaticky vytvoří role Postgres pro vaši identitu Databricks (například user@databricks.com). Tato role vlastní výchozí databricks_postgres databázi a je členem databricks_superusera poskytuje jí široká oprávnění ke správě databázových objektů.

Pokud se chcete připojit pomocí identity Databricks s OAuth, zkopírujte psql fragment připojení z dialogového okna připojení.

psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'

Po zadání příkazu psql připojení v terminálu se zobrazí výzva k zadání tokenu OAuth. Získejte token kliknutím na možnost Kopírovat token OAuth v dialogovém okně připojení.

Podrobnosti o připojení a možnosti ověřování najdete v rychlém startu.

Vytvoření první tabulky

Editor SQL Lakebase je předem naplněný ukázkovými SQL, které vám pomohou začít. V projektu vyberte produkční větev, otevřete Editor SQL a spusťte poskytnuté příkazy pro vytvoření playing_with_lakebase tabulky a vložení ukázkových dat. Editor tabulek můžete také použít ke správě vizuálních dat nebo se připojit k externím klientům Postgres.

Sql Editor s předem načteným ukázkovým SQL

Další informace o možnostech dotazování:Klienti Postgres | |

Registrace v katalogu Unity

Teď, když jste vytvořili tabulku v produkční větvi, zaregistrujeme databázi v katalogu Unity, abyste mohli tato data dotazovat z Editoru SQL Databricks.

  1. Pomocí přepínače aplikací přejděte na Lakehouse.
  2. V Průzkumníku katalogu klikněte na ikonu plus a vytvořte katalog.
  3. Zadejte název katalogu (například lakebase_catalog).
  4. Jako typ katalogu vyberte Lakebase Postgres a povolte možnost automatického škálování .
  5. Vyberte projekt, production větev a databricks_postgres databázi.
  6. Klikněte na Vytvořit.

Registrace databáze LKB v katalogu Unity

Teď můžete dotazovat playing_with_lakebase tabulku, kterou jste právě vytvořili z Editoru SQL Databricks, pomocí SQL Warehouse:

SELECT * FROM lakebase_catalog.public.playing_with_lakebase;

To umožňuje federované dotazy, které propojují transakční data Lakebase s analýzami lakehouse. Podrobnosti najdete v tématu Registrace v katalogu Unity.

Synchronizace dat pomocí reverse ETL

Právě jste viděli, jak se data Lakebase dají dotazovat v katalogu Unity. Lakebase funguje také v opačném směru: přenesení spravovaných analytických dat z Unity Catalog do databáze Lakebase. To je užitečné, když máte obohacená data, vlastnosti strojového učení nebo agregované metriky vypočítané ve vašem lakehouse, které musí podporovat aplikace s transakčními dotazy s nízkou latencí.

Nejprve vytvořte tabulku v katalogu Unity, která představuje analytická data. Otevřete SQL Warehouse nebo poznámkový blok a spusťte:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1001, 'premium', 2500.00, 'high'),
  (1002, 'standard', 450.00, 'medium'),
  (1003, 'premium', 3200.00, 'high'),
  (1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);

Teď synchronizujte tuto tabulku s databází Lakebase:

  1. V Průzkumníku katalogu Lakehouse přejděte na main>default>user_segments.
  2. Klikněte na Vytvořit>synchronizovanou tabulku.
  3. Konfigurace synchronizace:
    • Název tabulky: Enter user_segments_synced.
    • Typ databáze: Vyberte Bezserverovou databázi Lakebase (automatické škálování).
    • Režim synchronizace: Zvolte snímek pro jednorázovou synchronizaci dat.
    • Vyberte projekt, produkční větev a databricks_postgres databázi.
  4. Klikněte na Vytvořit.

Po dokončení synchronizace se tabulka zobrazí v databázi Lakebase. Proces synchronizace vytvoří default schéma v Postgres, aby odpovídalo schématu katalogu Unity, takže main.default.user_segments_synced se stane default.user_segments_synced. Přejděte zpět na Lakebase pomocí přepínače aplikací a dotazujte se na něj v Editoru SQL Lakebase:

SELECT * FROM "default"."user_segments_synced" WHERE "engagement" = 'high';

Dotazování synchronizovaných uživatelských segmentů v Editoru SQL Lakebase

Analýzy lakehouse jsou teď k dispozici pro poskytování v transakčních databázích v reálném čase. Informace o průběžné synchronizaci, pokročilých konfiguracích a mapování datových typů najdete v tématu Reverse ETL.

Další kroky

Tutorials

Connect

Klíčové funkce

Prozkoumat další informace