Kernkonzepte

Lakebase basiert auf einer Reihe von Features, mit denen Sie Ihre Datenbankanwendungen effizient entwickeln, testen und skalieren können. In diesem Abschnitt werden die Kernkonzepte vorgestellt, die Lakebase von herkömmlichen Datenbanksystemen unterscheiden.

Projekte

Ein Lakebase-Projekt ist der Container der obersten Ebene für alle Datenbankressourcen. Jedes Projekt gehört zu einem Databricks-Arbeitsbereich und enthält einen oder mehrere Branches, jeweils mit eigenen Compute-Ressourcen und Datenbanken.

Project
└── Branch (e.g., production)
    ├── Compute (read-write)
    └── Database (e.g., databricks_postgres)

Weitere Informationen: Projekte | verwalten

Automatische Skalierung

Lakebase passt die Berechnungsressourcen basierend auf Ihren Workloadanforderungen automatisch an. Wenn der Datenverkehr Ihrer Anwendung zunimmt oder verringert wird, skalieren Sie Ressourcen innerhalb Ihres konfigurierten Bereichs nach oben oder unten, ohne manuelle Eingriffe oder Ausfallzeiten.

Wichtige Vorteile:

  • Automatische Anpassung: Ressourcenskalierung basierend auf der tatsächlichen Nachfrage.
  • Keine Ausfallzeiten: Die Skalierung innerhalb des konfigurierten Bereichs erfolgt ohne Unterbrechung von Verbindungen. Eine Änderung der minimalen oder maximalen CU-Konfiguration kann jedoch zu einer kurzen Unterbrechung führen.
  • Kostenoptimierung: Zahlen Sie nur für die Ressourcen, die Sie tatsächlich verwenden.
  • Leistungskonsistenz: Halten Sie die reaktionsfähige Leistung bei Datenverkehrsspitzen aufrecht.

Weitere Informationen: Automatisches Skalieren | Konfigurieren der automatischen Skalierung

Zu Null skalieren

Wenn Ihre Datenbank im Leerlauf ist, kann Lakebase Automatisch Computeressourcen auf Null skalieren, wodurch Kosten für nicht verwendete Kapazität eliminiert werden. Wenn die Aktivität fortgesetzt wird, wird Ihre Rechenleistung automatisch in Sekunden wieder hochskaliert.

Wichtige Vorteile:

  • Null Leerlaufkosten: Keine Berechnungsgebühren, wenn Ihre Datenbank inaktiv ist.
  • Sofortige Wiederaufnahme: Datenbanken wachen automatisch auf, wenn auf sie zugegriffen wird.
  • Entwicklungsfreundlich: Ideal für Entwicklungs- und Stagingumgebungen mit zeitweiliger Nutzung.
  • Automatische Verwaltung: Kein manueller Eingriff erforderlich.

Weitere Informationen: Skalierung auf Null | Skalierung auf Null konfigurieren

Datenbankzweige

Datenbankzweige in Lakebase funktionieren ähnlich wie Git Branches für Ihren Code. Sie können sofortige, isolierte Verzweigungen für Entwicklung, Tests oder Experimente erstellen, ohne Daten zu duplizieren oder ihre Produktionsumgebung zu beeinträchtigen.

Wichtige Vorteile:

  • Sofortige Erstellung: Mithilfe der Copy-on-Write-Technologie werden Verzweigungen innerhalb von Sekunden erstellt.
  • Kosteneffizient: Nur geänderte Daten werden separat gespeichert, wodurch die Speicherkosten minimiert werden.
  • Isolierte Umgebungen: Testen Sie Änderungen sicher, ohne dass sich dies auf Ihre primäre Datenbank auswirkt.
  • Einfache Zusammenarbeit: Teammitglieder können gleichzeitig an separaten Zweigstellen arbeiten.

Weitere Informationen: Datenbankzweige | Zweige verwalten

Berechnungen und Endgeräte

Ein Lakebase-Endpunkt ist der stabile Verbindungspunkt, den Ihre Anwendung verwendet, um eine Datenbank zu erreichen. Hinter jedem Endpunkt behandeln eine oder mehrere Computeinstanzen die Abfrageverarbeitung. Ihre Verbindungszeichenfolge bleibt gleich, auch wenn Sie Computeressourcen skalieren oder eine hohe Verfügbarkeit hinzufügen.

Ein Branch verfügt in der Regel über einen Lese-/Schreibendpunkt (Ihre primäre Compute-Instanz) und optional über einen oder mehrere schreibgeschützte Endpunkte (Lesereplikate).

Weitere Informationen: Compute-Instanzen und Endpunkte | Compute-Instanzen verwalten

Hohe Verfügbarkeit

Hochverfügbarkeit kombiniert eine primäre Lese-/Schreib-Compute-Instanz mit einer oder mehreren sekundären Berechnungseinheiten, die über Verfügbarkeitszonen verteilt sind. Wenn die Primärinstanz nicht mehr verfügbar ist, wird automatisch eine Sekundärinstanz heraufgestuft, und Ihre Anwendung wird ab der zuletzt bestätigten Transaktion fortgesetzt. Ihre Verbindungszeichenfolge bleibt durchgehend unverändert.

Wichtige Vorteile:

  • Automatisches Failover: Eine sekundäre Computeinstanz wird ohne manuelle Eingriffe höhergestuft.
  • Kein Datenverlust: Failover behält alle zugesicherten Transaktionen bei.
  • Stabile Verbindungszeichenfolgen: Ihre Anwendung muss ihre Verbindungskonfiguration nach einem Failover nicht mehr ändern.

Weitere Informationen: Hochverfügbarkeit | Hochverfügbarkeit verwalten

Lesereplikate

Lesereplikate sind unabhängige schreibgeschützte Instanzen, die Lesevorgänge an denselben Daten wie Ihre primäre Lese-/Schreibinstanz ausführen. Im Gegensatz zu herkömmlichen Replikaten dupliziert Lakebase-Lesereplikate keine Daten – sie lesen von derselben Speicherebene, wodurch die sofortige Erstellung ermöglicht und zusätzliche Speicherkosten vermieden werden.

Wichtige Vorteile:

  • Horizontale Skalierung: Verteilen von Leseanforderungen über mehrere Replikate hinweg.
  • Keine Datenduplizierung: Alle Replikate werden aus demselben Speicher gelesen.
  • Sofortige Erstellung: In Sekunden ohne Datenkopie verfügbar.
  • Kosteneffizient: Keine zusätzlichen Speicherkosten sowie automatische Skalierung und Skalierungs-zu-Null-Unterstützung.

Weitere Informationen: Lesen von Replikaten | Verwalten von Lesereplikaten

Wie sie zusammenarbeiten

Diese Kernkonzepte arbeiten zusammen, um eine leistungsstarke und flexible Datenbankplattform zu schaffen:

  1. Projekte organisieren alle Datenbankressourcen und gehören zu einem Databricks-Arbeitsbereich.
  2. Automatische Skalierung stellt sicher, dass jeder Branch je nach Bedarf über die richtige Rechenkapazität verfügt.
  3. Scale-to-zero senkt die Kosten für inaktive Branches, indem Rechenressourcen bei Nichtnutzung angehalten werden.
  4. Mit Datenbankzweigen können Sie isolierte Umgebungen für Entwicklung und Tests erstellen, ohne Daten zu duplizieren.
  5. Rechenressourcen und Endpunkte stellen stabile Verbindungspunkte bereit, während Sie Ihre Infrastruktur skalieren oder umkonfigurieren.
  6. Hohe Verfügbarkeit ermöglicht automatisches Failover zwischen Verfügbarkeitszonen für Produktionsworkloads.
  7. Lesereplikate verteilen Lesedatenverkehr über zusätzliche Computeinstanzen.

Mit dieser Architektur können Sie Datenbankanwendungen mit größerer Flexibilität, geringeren Kosten und geringerem Betriebsaufwand erstellen und skalieren als herkömmliche Datenbanksysteme.