Freigeben über


Was ist Lakebase Autoscaling?

Von Bedeutung

Lakebase Autoscaling ist in Beta in den folgenden Regionen: eastus2, westeurope, westus.

Lakebase Autoscaling ist die neueste Version von Lakebase mit automatischer Berechnung, Skalierung bis Null, Verzweigung und sofortiger Wiederherstellung. Einen Featurevergleich mit Lakebase Provisioned finden Sie unter Auswahl zwischen Versionen.

Lakebase Postgres Autoscaling ist eine vollständig verwaltete Postgres-Datenbank, die in die Databricks Data Intelligence Platform integriert ist. Es bietet OLTP-Funktionen (Transaktionsverarbeitungsfunktionen) für Ihr Data Lakehouse, sodass Sie zusammen mit Ihren Analysearbeitslasten Echtzeit-Transaktionsanwendungen erstellen können.

Lakebase Postgres Autoscaling kombiniert die Zuverlässigkeit und Vertrautheit von Postgres mit modernen Datenbankfunktionen, einschließlich Autoscaling, Skalierung auf Null, Branching und sofortiger Wiederherstellung. Diese Features ermöglichen flexible Entwicklungsworkflows, kosteneffiziente Vorgänge und schnelle Iterationen.

Lakebase-Integration in Unity-Katalog und -Anwendungen

Organisieren von Projekten

Das Verständnis der Hierarchie von Lakebase-Objekten hilft Ihnen, Ihre Ressourcen zu organisieren und zu verwalten:

Databricks Workspace
  └── Project(s)
      └── Branch(es)
          ├── Compute (primary R/W)
          ├── Read replica(s) (optional)
          ├── Role(s)
          └── Database(s)
                 └── Schema(s)

Jede Ebene in der Hierarchie dient einem bestimmten Zweck:

Object Description
Projekt Der Container der obersten Ebene für Ihre Datenbankressourcen. Ein Projekt enthält Verzweigungen, Datenbanken, Rollen und Computeressourcen. Siehe "Projekte verwalten".
Filiale Eine isolierte Datenbankumgebung, die Speicher mit ihrem übergeordneten Zweig teilt. Jedes Projekt kann mehrere Verzweigungen enthalten. Siehe "Verzweigungen verwalten".
Berechnen Der Postgres-Server, der eine Verzweigung unterstützt. Jede Niederlassung verfügt über eigene Rechner, die die Verarbeitungsleistung und den Arbeitsspeicher für Datenbankvorgänge bereitstellen. Siehe "Compute verwalten".
Datenbank Eine standardmäßige Postgres-Datenbank innerhalb eines Zweigs. Jede Verzweigung kann mehrere Datenbanken mit eigenen Tabellen, Schemas und Daten enthalten. Siehe "Datenbanken verwalten".

Grundlegendes zu Branches

Eines der leistungsstärksten Features von Lakebase Postgres ist die Verzweigung. Wie Git-Branches für Ihren Code ermöglichen es Branches, isolierte Datenbankumgebungen für die Entwicklung und das Testen zu erstellen – ohne die Produktion zu beeinflussen.

Warum dies wichtig ist: Herkömmliche Datenbankworkflows erfordern separate Entwicklungs- und Stagingserver, manuelle Datenaktualisierungen und sorgfältige Koordination. Mit Zweigniederlassungen können Sie:

  • Erstellen sie sofort eine Entwicklungsumgebung mit Produktionsdaten
  • Testen sie Schemaänderungen sicher, bevor Sie sie auf die Produktion anwenden
  • Sich von Fehlern erholen, indem Verzweigungen von einem beliebigen Zeitpunkt aus erstellt werden.
  • Zahlen Sie nur für die Daten, die Sie ändern, nicht für vollständige duplizierte Datenbanken
Thema Description
Filialen Erfahren Sie, wie Zweigniederlassungen funktionieren, allgemeine Workflows und bewährte Methoden für Ihr Team.
Verwalten von Branches Erstellen, Zurücksetzen und Löschen von Verzweigungen für Entwicklung und Tests.
Geschützte Branches Schützen Sie Produktionszweige vor versehentlichen Änderungen und Löschungen.

Kernkonzepte

Lakebase basiert auf mehreren wichtigen Innovationen, die sie von herkömmlichen Datenbanksystemen unterscheiden:

  • Getrennte Berechnung und Speicher: Skalieren Sie Computeressourcen unabhängig vom Speicher für Kosteneffizienz und Flexibilität.
  • Autoskalierung: Die Rechenleistung wird basierend auf der Workload-Nachfrage automatisch angepasst, mit Unterstützung für die Skalierung auf Null während Leerlaufzeiten.
  • Copy-on-Write-Speicher: Ermöglicht die sofortige Verzweigungen, bei der Sie nur für Datenänderungen bezahlen, nicht für vollständige Duplikate.
  • Sofortige Point-in-Time-Vorgänge: Wiederherstellen zu einem beliebigen Zeitpunkt innerhalb des konfigurierten Wiederherstellungsfensters (0-30 Tage) oder Erstellen von Zweigen.

Diese Konzepte arbeiten zusammen, um flexible Entwicklungsworkflows, kosteneffiziente Vorgänge und schnelle Wiederherstellung von Fehlern zu ermöglichen.

Eine ausführliche Erläuterung der einzelnen Kernkonzepte finden Sie unter "Kernkonzepte".