Freigeben über


Erste Schritte mit Lakebase Postgres

Von Bedeutung

Lakebase Autoscaling ist in Beta in den folgenden Regionen: eastus2, westeurope, westus.

Lakebase Autoscaling ist die neueste Version von Lakebase mit automatischer Berechnung, Skalierung bis Null, Verzweigung und sofortiger Wiederherstellung. Einen Featurevergleich mit Lakebase Provisioned finden Sie unter Auswahl zwischen Versionen.

** Starten Sie in wenigen Minuten mit Lakebase Postgres. Erstellen Sie Ihr erstes Projekt, stellen Sie eine Verbindung mit Ihrer Datenbank her, und erkunden Sie die wichtigsten Features, einschließlich der Unity-Katalogintegration.

Erstellen Ihres ersten Projekts

Öffnen Sie die Lakebase-App über den App-Switcher.

Apps-Switcher

Wählen Sie "Automatische Skalierung" aus, um auf die Lakebase-Benutzeroberfläche für die automatische Skalierung zuzugreifen.

Klicke auf Neues Projekt. Geben Sie Ihrem Projekt einen Namen, und wählen Sie Ihre Postgres-Version aus. Ihr Projekt wird mit einem einzelnen production Branch, einer Standard databricks_postgres Datenbank und konfigurierten Computerressourcen für den Branch erstellt.

Dialogfeld

Es kann einige Momente dauern, bis Ihr Computer startet. Die Berechnung für die production Verzweigung ist standardmäßig aktiviert (Scale-to-Zero ist deaktiviert), Sie können diese Einstellung jedoch bei Bedarf konfigurieren.

Die Region für Ihr Projekt wird automatisch auf Ihre Arbeitsbereichsregion festgelegt. Ausführliche Konfigurationsoptionen finden Sie unter Erstellen eines Projekts.

Verbinden mit der Datenbank

Wählen Sie im Projekt den Produktionszweig aus, und klicken Sie auf "Verbinden". Sie können eine Verbindung mit Ihrer Databricks-Identität mit OAuth-Authentifizierung herstellen oder eine systemeigene Postgres-Kennwortrolle erstellen. Verbindungszeichenfolgen funktionieren mit standardmäßigen Postgres-Clients wie psqlpgAdmin oder einem beliebigen Postgres-kompatiblen Tool.

Dialogfeld

Wenn Sie ein Projekt erstellen, wird automatisch eine Postgres-Rolle für Ihre Databricks-Identität (z. B user@databricks.com. ) erstellt. Diese Rolle besitzt die Standarddatenbank databricks_postgres und ist Mitglied von databricks_superuser, wodurch sie umfassende Berechtigungen zum Verwalten von Datenbankobjekten erhält.

Um eine Verbindung mit Ihrer Databricks-Identität mit OAuth herzustellen, kopieren Sie den psql Verbindungsausschnitt aus dem Verbindungsdialogfeld.

psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'

Nachdem Sie den psql Verbindungskomoand in Ihr Terminal eingegeben haben, werden Sie aufgefordert, ein OAuth-Token bereitzustellen. Rufen Sie Ihr Token ab, indem Sie im Verbindungsdialogfeld auf die Option "OAuth-Token kopieren " klicken.

Verbindungsdetails und Authentifizierungsoptionen finden Sie in der Schnellstartanleitung.

Ihre erste Tabelle erstellen

Der Lakebase SQL-Editor ist bereits mit BEISPIEL-SQL geladen, um Ihnen den Einstieg zu erleichtern. Wählen Sie in Ihrem Projekt den Produktionszweig aus, öffnen Sie den SQL-Editor, und führen Sie die bereitgestellten Anweisungen aus, um eine playing_with_lakebase Tabelle zu erstellen und Beispieldaten einzufügen. Sie können auch den Tabellen-Editor für die visuelle Datenverwaltung oder die Verbindung mit externen Postgres-Clients verwenden.

SQL-Editor mit vorinstallierter Beispiel-SQL

Weitere Informationen zu Abfrageoptionen: SQL Editor | Tables Editor | Postgres-Clients

Registrieren im Unity-Katalog

Nachdem Sie nun eine Tabelle in Ihrem Produktionszweig erstellt haben, registrieren wir die Datenbank im Unity-Katalog, damit Sie diese Daten aus dem SQL-Editor von Databricks abfragen können.

  1. Verwenden Sie den App-Switcher, um zu Lakehouse zu navigieren.
  2. Klicken Sie im Katalog-Explorer auf das Plussymbol, und erstellen Sie einen Katalog.
  3. Geben Sie einen Katalognamen ein (z. B lakebase_catalog. ).
  4. Wählen Sie Lakebase Postgres als Katalogtyp aus, und aktivieren Sie die Option "Automatische Skalierung ".
  5. Wählen Sie Ihr Projekt, die production Verzweigung und die databricks_postgres Datenbank aus.
  6. Klicken Sie auf "Erstellen".

Registrieren der LKB-Datenbank im Unity-Katalog

Sie können jetzt die soeben aus dem Databricks SQL Editor erstellte Tabelle mit Hilfe eines SQL Warehouse abfragen.

SELECT * FROM lakebase_catalog.public.playing_with_lakebase;

Dies ermöglicht Verbundabfragen, die Ihre Lakebase-Transaktionsdaten mit Lakehouse-Analysen verknüpfen. Ausführliche Informationen finden Sie unter "Registrieren im Unity-Katalog".

Synchronisieren von Daten mit Reverse ETL

Sie haben gerade gesehen, wie Sie Lakebase-Daten im Unity-Katalog abfragbar machen. Lakebase funktioniert auch in umgekehrter Richtung: Die zusammengestellten Analysedaten aus dem Unity-Katalog in Ihre Lakebase-Datenbank integrieren. Dies ist nützlich, wenn Sie erweiterte Daten, ML-Features oder aggregierte Metriken in Ihrem Lakehouse berechnet haben, die von Anwendungen mit Transaktionsabfragen mit geringer Latenz bereitgestellt werden müssen.

Erstellen Sie zunächst eine Tabelle im Unity-Katalog, die analytische Daten darstellt. Öffnen Sie ein SQL Warehouse oder Notizbuch, und führen Sie Folgendes aus:

CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
  (1001, 'premium', 2500.00, 'high'),
  (1002, 'standard', 450.00, 'medium'),
  (1003, 'premium', 3200.00, 'high'),
  (1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);

Synchronisieren Sie diese Tabelle nun mit Ihrer Lakebase-Datenbank:

  1. Navigieren Sie im Lakehouse-Katalog-Explorer zu main>default>user_segments.
  2. Klicken Sie auf ">".
  3. Konfigurieren Sie die Synchronisierung:
    • Tabellenname: Geben Sie user_segments_syncedein.
    • Datenbanktyp: Wählen Sie Lakebase Serverless (Autoscaling).
    • Synchronisierungsmodus: Wählen Sie "Snapshot" für eine einmalige Datensynchronisierung aus.
    • Wählen Sie Ihr Projekt, den Produktionszweig und die databricks_postgres Datenbank aus.
  4. Klicken Sie auf "Erstellen".

Nach Abschluss der Synchronisierung wird die Tabelle in Ihrer Lakebase-Datenbank angezeigt. Der Synchronisierungsprozess erstellt ein default Schema in Postgres, um dem Unity-Katalogschema zu entsprechen, so main.default.user_segments_synced wird default.user_segments_synced. Navigieren Sie mithilfe des App-Switchers zurück zu Lakebase, und fragen Sie sie im Lakebase SQL-Editor ab:

SELECT * FROM "default"."user_segments_synced" WHERE "engagement" = 'high';

Abfrage synchronisierter Benutzersegmente im Lakebase SQL-Editor

Ihre Lakehouse-Analysen sind jetzt für die Echtzeit-Bereitstellung in Ihrer Transaktionsdatenbank verfügbar. Informationen zur kontinuierlichen Synchronisierung, erweiterten Konfigurationen und Datentypzuordnungen finden Sie unter Reverse ETL.

Nächste Schritte

Anleitungen

Verbinden

Wichtigste Funktionen

Mehr entdecken