Skalierung auf null

Automatische Skalierung auf null setzt das Lakebase-Computing nach einer Phase der Inaktivität automatisch aus, wodurch die Kosten für Datenbanken minimiert werden, die nicht durchgängig genutzt werden. Diese Funktion ist besonders für Entwicklungs-, Test- und Stagingumgebungen sowie Produktionsdatenbanken mit vorhersehbaren Leerlaufzeiten nützlich.

Wenn die Skalierung auf Null aktiviert ist:

  • Die Berechnung wird nach einem Zeitraum der Inaktivität automatisch angehalten. Das Inaktivitätstimeout ist standardmäßig auf 24 Stunden festgelegt und kann zwischen 60 Sekunden und 7 Tagen festgelegt werden.
  • Sie zahlen nur für die aktive Berechnungszeit, nicht für Leerlaufzeiten
  • Die Berechnung reaktiviert automatisch innerhalb weniger hundert Millisekunden, wenn Sie eine neue Abfrage ausführen

Dieses Diagramm veranschaulicht das Verhalten beim Skalieren auf Null zusammen mit der automatischen Skalierung, wobei ein inaktiver Zeitraum gefolgt von einer automatischen Aussetzung gezeigt wird, bis erneut auf die Datenbank zugegriffen wird.

Skalierung auf Nullvisualisierung

Skalierung auf Null funktioniert unabhängig von der automatischen Skalierung. Durch die automatische Skalierung werden Die Berechnungsressourcen während der aktiven Zeiträume basierend auf der Auslastungsnachfrage angepasst. Die Skalierung auf Null hält die Berechnung während der Inaktivität vollständig an, wodurch die Berechnungskosten auf Null reduziert werden.

Funktionsweise der Skalierung auf Null

Automatisches Anhalten

Wenn Ihre Compute-Ressource für die konfigurierte Timeout-Dauer im Leerlauf bleibt (keine Abfragen oder Verbindungen empfängt), setzt Lakebase sie automatisch aus. Während des Anhaltens:

  • Die Berechnung verbraucht keine Ressourcen und verursacht keine Berechnungskosten.
  • Ihre Daten bleiben sicher gespeichert und verfügbar
  • Verbindungszeichenfolgen und Anmeldeinformationen bleiben gültig.
  • Der Computeendpunkt bleibt zugänglich, aber inaktiv

Automatische Reaktivierung

Wenn eine neue Abfrage- oder Verbindungsanforderung bei einer angehaltenen Berechnung eingeht, reaktiviert Lakebase sie automatisch. Der Reaktivierungsprozess:

  • Erfordert keinen manuellen Eingriff
  • Behandelt die Verbindungsanforderung nach der Aktivierung transparent.
  • Stellt die Berechnung auf die konfigurierte Mindestgröße wieder her (wenn die automatische Skalierung aktiviert ist)

Anwendungen sollten Verbindungswiederholungslogik implementieren, um den kurzen Reaktivierungszeitraum ordnungsgemäß zu handhaben.

Zeitlimitkonfiguration

Sie konfigurieren das Timeout für das Herunterskalieren auf Null, um zu steuern, wie schnell eine Rechenressource nach Inaktivität ausgesetzt wird. Sie können sie zwischen 60 Sekunden (1 Minute) und 7 Tagen festlegen. Das Timeout bestimmt das Gleichgewicht zwischen:

  • Kürzere Timeout-Zeiten (im Minutenbereich): Schnelleres Suspendieren reduziert die Kosten, kann aber bei sporadischen Workloads zu häufigeren Reaktivierungen führen
  • Längere Timeouts (Stunden bis Tage): Weniger Reaktivierungen verbessern die Benutzererfahrung für sporadische Aktivitäten. Das Standardmäßige 24-Stunden-Timeout eignet sich für die meisten Produktionsdatenbanken. Sie können das Fenster bis zum Maximalwert von 7 Tagen verlängern, wenn die Berechnung während leerer Strecken länger aktiv bleiben soll.

Skalierung auf null Vorteile

  • Kostensenkung: Durch das Aussetzen inaktiver Rechner zahlen Sie nur für die tatsächliche Nutzungszeit. Eine Entwicklungsdatenbank, die 8 Stunden pro Tag verwendet wird, kostet ein Drittel so viel wie eine immer aktive Berechnung.
  • Flexible Bereitstellung: Die Skalierung auf Null ermöglicht eine kostengünstige Bereitstellung mehrerer Umgebungen. Sie können separate Entwicklungs-, Test-, Staging- und Vorschauumgebungen verwalten, ohne dass jeweils 24/7 Berechnungskosten anfallen.
  • Keine manuelle Verwaltung: Das System übernimmt automatisch das Anhalten und Reaktivieren, sodass die Notwendigkeit entfällt, Rechenvorgänge basierend auf Nutzungsmustern manuell zu starten und zu beenden.
  • Beibehaltene Konfiguration: Alle Computeeinstellungen, Verbindungsdetails und Datenbankkonfigurationen bleiben während des Anhaltens erhalten. Wenn der Rechner reaktiviert wird, nimmt er mit derselben Konfiguration den Betrieb wieder auf.

Konfigurieren der Skalierung auf Null

Skalierung auf Null kann für jede Berechnung aktiviert oder deaktiviert werden. Wenn diese Option aktiviert ist, legen Sie das Timeout bei Inaktivität fest, nach dessen Ablauf die Suspendierung ausgelöst wird. Der Standardwert ist 24 Stunden, und der zulässige Bereich beträgt 60 Sekunden bis 7 Tage.

Das Standardmäßige 24-Stunden-Timeout eignet sich gut für die meisten Datenbanken, wodurch die Kosten während erweiterter Leerlaufzeiten reduziert werden, während reaktivierungen selten bleiben. Wenn Ihre Workload eine kontinuierliche Verfügbarkeit ohne Startlatenz erfordert, deaktivieren Sie die Skalierung für diese Berechnung auf Null. Für Entwicklungszweige reduzieren kürzere Timeouts wie 30 Minuten die Kosten weiter.

Ausführliche Anweisungen zum Konfigurieren von Einstellungen für die Skalierung auf Null finden Sie unter Verwalten von Rechnern.

Allgemeine Skalierung auf Null-Szenarien

Entwicklungs- und Testumgebungen

Entwicklungszweige zum Testen von Schemaänderungen, Validieren von Datenpipelines oder Experimentieren mit neuen Features weisen typischerweise intermittierende Aktivität auf. Skalierung auf Null setzt diese Berechnungen während Abenden, Wochenenden und zwischen Arbeitssitzungen automatisch aus, wodurch die Kosten erheblich reduziert werden.

Staging- und Vorschauumgebungen

Stagingumgebungen, die für die Vorabbereitstellungsüberprüfung oder Vorschauumgebungen verwendet werden, die für Pullanforderungen erstellt wurden, bleiben häufig zwischen Testzyklen im Leerlauf. Skalierung auf Null stellt sicher, dass diese Umgebungen Ressourcen nur während der aktiven Testzeiträume verbrauchen.

KI-Agents und -Anwendungen mit Leerlaufzeiten

KI-Agents, Chatbots oder interne Tools, die bestimmte Geschäftszeiten bedienen oder vorhersehbare Ausfallzeiten aufweisen, können von der Skalierung auf Null profitieren. Der Rechner wird außerhalb der Betriebszeiten angehalten und reaktiviert sich automatisch, wenn Benutzer zurückkehren.

Anwendungsdatenbanken mit mehreren Mandanten

Anwendungen, die mehrere Kunden bedienen, können für mandantenspezifische Datenbanken eine Skalierung auf Null verwenden. Die Rechenleistungen für inaktive Mandanten werden automatisch ausgesetzt, wodurch die aggregierten Computekosten für alle Mandanten reduziert werden.

Wichtige Überlegungen

Zurücksetzen des Sitzungskontexts

Wenn ein Computer angehalten und später reaktiviert wird, wird der Sitzungskontext zurückgesetzt. Dazu gehören:

  • In-Memory-Statistiken und Cacheinhalte
  • Temporäre Tabellen und vorbereitete Statements
  • Sitzungsspezifische Konfigurationseinstellungen
  • Verbindungspools und aktive Transaktionen

Wenn Ihre Anwendung dauerhafte Sitzungsdaten erfordert, sollten Sie erwägen, die Skalierung auf Null zu deaktivieren, um die fortlaufende Computeverfügbarkeit aufrechtzuerhalten.

Startlatenz

Der kurze Reaktivierungszeitraum (in der Regel ein paar hundert Millisekunden) wirkt sich möglicherweise auf die Benutzererfahrung für die erste Abfrage nach dem Anhalten aus. Für Anwendungen, die sofortige Reaktionszeiten erfordern, können Sie folgende Aktionen ausführen:

  • Skalierung auf null für stets verfügbare Compute-Instanzen deaktivieren
  • Implementieren der Erwärmung der Verbindung auf Anwendungsebene
  • Verwenden sie längere Timeoutperioden, um die Reaktivierungshäufigkeit zu reduzieren.

Verhalten von Produktionszweigen

Wenn Sie ein Projekt erstellen, wird der production Branch standardmäßig mit aktivierter Skalierung auf null und einem Inaktivitäts-Timeout von 24 Stunden erstellt. Sie können das Timeout anpassen oder die Skalierung für den Produktionszweig auf Null deaktivieren, wenn Ihre Workload eine kontinuierliche Verfügbarkeit erfordert.

Skalierung auf Null und automatische Skalierung

Skalierung auf Null ergänzt die automatische Skalierung , um leistung und Kosten zu optimieren:

  • Während der aktiven Zeiträume: Durch die automatische Skalierung wird die Rechenkapazität basierend auf der Workload-Nachfrage innerhalb Ihres konfigurierten Bereichs angepasst, wobei bei hoher Aktivität nach oben und bei leichteren Lasten nach unten skaliert wird.
  • Während inaktiver Zeiträume: Nach dem Zeitlimit für die Skalierung auf null wird die Berechnung angehalten und die Computekosten sinken auf null, unabhängig von der konfigurierten Autoskalierungsgrenze.
  • Bei reaktivierter Aktivierung: Die Berechnung startet mit der minimalen automatischen Skalierungsgröße neu (wenn die automatische Skalierung aktiviert ist), und die automatische Skalierung passt dann Ressourcen basierend auf der neuen Workload an.

Diese Kombination maximiert die Effizienz: Durch die automatische Skalierung wird die Ressourcennutzung während der Aktivität optimiert, während die Skalierung auf Null die Kosten während der Inaktivität beseitigt.

Nächste Schritte

  • Konfigurieren Sie Skalierungs-zu-Null-Einstellungen: Erfahren Sie, wie Sie die Skalierung für Ihre Berechnungen aktivieren, anpassen oder deaktivieren. Siehe Skalierung auf Null.
  • Computemetriken anzeigen: Sehen Sie, wie Metriken inaktive Computezeiträume und das Scale-to-Zero-Verhalten widerspiegeln. Siehe Metrik-Dashboard.
  • Automatische Skalierung: Erfahren Sie, wie Compute-Ressourcen in Zeiten hoher Auslastung angepasst werden. Siehe Autoscaling.
  • Datenbankzweige: Erstellen von isolierten Datenbankumgebungen für Entwicklung und Tests. Siehe Verzweigungen.