Ridimensionamento a zero

Importante

La scalabilità automatica di Lakebase si trova in Beta nelle aree seguenti: eastus2, westeurope, westus.

Lakebase Autoscaling è la versione più recente di Lakebase con calcolo autoscalante, riduzione a zero, ramificazione e ripristino istantaneo. Per il confronto delle funzionalità con Lakebase Provisioned, vedere scegliere tra le versioni.

La scalabilità su zero sospende automaticamente il calcolo di Lakebase dopo un periodo di inattività, riducendo al minimo i costi per i database che non sono continuamente attivi. Questa funzionalità è particolarmente utile per gli ambienti di sviluppo, test e gestione temporanea, nonché per i database di produzione con periodi di inattività prevedibili.

Quando la scalabilità su zero è abilitata:

Il calcolo viene sospeso automaticamente dopo un periodo di inattività (il valore predefinito è 5 minuti, minimo è 60 secondi)
Si paga solo per il tempo di calcolo attivo, non per i periodi di inattività
Il calcolo reagisce automaticamente entro poche centinaia di millisecondi quando si esegue una nuova query

Questo diagramma illustra la scalabilità a zero comportamento insieme alla scalabilità automatica, che mostra un periodo di inattività seguito dalla sospensione automatica fino a quando non si accede nuovamente al database.

Ridimensionare fino a zero visualizzazione

La scalabilità a zero funziona in modo indipendente dalla scalabilità automatica. Mentre la scalabilità automatica regola le risorse di calcolo durante i periodi attivi in base alla domanda del carico di lavoro, la scalabilità su zero sospende completamente il calcolo durante l'inattività, riducendo i costi di calcolo a zero.

Funzionamento della scalabilità a zero

Sospensione automatica

Quando il calcolo rimane inattivo per il periodo di timeout configurato, senza ricevere query o connessioni, Lakebase lo sospende automaticamente. Durante la sospensione:

Il calcolo non utilizza risorse e non comporta costi di calcolo
I dati rimangono archiviati e disponibili in modo sicuro
Le stringhe di connessione e le credenziali rimangono valide
L'endpoint di calcolo rimane accessibile ma inattivo

Riattivazione automatica

Quando una nuova query o una nuova richiesta di connessione arriva a un calcolo sospeso, Lakebase la riattiva automaticamente. Processo di riattivazione:

Non richiede alcun intervento manuale
Gestisce in modo trasparente la richiesta di connessione una volta attiva
Ripristina le dimensioni minime configurate del calcolo (se la scalabilità automatica è abilitata)

Le applicazioni devono implementare la logica di ripetizione dei tentativi di connessione per gestire correttamente il breve periodo di riattivazione.

Configurazione del timeout

È possibile configurare il timeout di riduzione a zero per controllare quanto rapidamente le risorse di calcolo si sospendono dopo che sono diventate inattive. Il timeout determina il bilanciamento tra:

Timeout più brevi (60 secondi - 5 minuti): una sospensione più veloce riduce i costi, ma può causare riattivazioni più frequenti con carichi di lavoro intermittenti
Timeout più lunghi (5 minuti - 1 ora): meno riattivazioni migliorano l'esperienza dell'utente per attività sporadiche, ma possono aumentare i costi durante i periodi di inattività prolungati

Il timeout minimo è 60 secondi. Il valore massimo è configurabile in base al caso d'uso.

Scalabilità a zero vantaggi

Riduzione dei costi: Sospendendo i calcoli inattivi, si paga solo per il tempo di utilizzo effettivo. Un database di sviluppo usato 8 ore al giorno costa un terzo del calcolo sempre attivo.
Distribuzione flessibile: La scalabilità a zero consente la distribuzione conveniente di più ambienti. È possibile gestire ambienti di sviluppo, test, staging e anteprima separati senza incorrere in costi di calcolo 24/7 per ognuno.
Nessuna gestione manuale: Il sistema gestisce automaticamente la sospensione e la riattivazione, eliminando la necessità di avviare e arrestare manualmente i calcoli in base ai modelli di utilizzo.
Configurazione mantenuta: Tutte le impostazioni di calcolo, i dettagli di connessione e le configurazioni del database rimangono intatte durante la sospensione. Quando il calcolo reagisce, riprende con la stessa configurazione.

Configurazione della scala a zero

La scalabilità su zero può essere abilitata o disabilitata per qualsiasi calcolo. Se abilitata, si configura il timeout di inattività che attiva la sospensione (il valore predefinito è 5 minuti, minimo è 60 secondi).

Una configurazione comune è che i rami di produzione abbiano la scalabilità su zero disabilitata per la disponibilità continua, mentre i rami di sviluppo hanno la possibilità di ottimizzare i costi.

Per istruzioni dettagliate sulla configurazione delle impostazioni da scala a zero, vedere Gestire i calcoli.

Scenari comuni di scalabilità a zero

Ambienti di sviluppo e test

I rami di sviluppo per testare le modifiche dello schema, convalidare le pipeline di dati o sperimentare nuove funzionalità visualizzano in genere attività intermittenti. La scalabilità su zero sospende automaticamente questi calcoli durante le serate, i fine settimana e tra le sessioni lavorative, riducendo significativamente i costi.

Ambienti di gestione temporanea e anteprima

Gli ambienti di gestione temporanea usati per la convalida pre-distribuzione o gli ambienti di anteprima creati per le richieste pull spesso rimangono inattive tra i cicli di test. La scalabilità su zero garantisce che questi ambienti consumino le risorse solo durante i periodi di test attivi.

Agenti di intelligenza artificiale e applicazioni con periodi di inattività

Gli agenti di intelligenza artificiale, i chatbot o gli strumenti interni che servono ore lavorative specifiche o hanno modelli di tempo di inattività prevedibili possono trarre vantaggio dalla scalabilità a zero. Il calcolo viene sospeso durante gli orari di minore attività e riattiva automaticamente quando gli utenti tornano.

Database dell'applicazione multi-tenant

Le applicazioni che servono più clienti possono usare la scalabilità a zero per i database specifici del tenant. I calcoli per i tenant inattivi si sospendono automaticamente, riducendo i costi di calcolo aggregati tra tutti i tenant.

Considerazioni importanti

Reimpostazione del contesto della sessione

Quando un ambiente di calcolo sospende e successivamente riattiva, il contesto della sessione viene reimpostato. Sono inclusi:

Statistiche in memoria e contenuto della cache
Tabelle temporanee e istruzioni preparate
Impostazioni di configurazione specifiche della sessione
Pool di connessioni e transazioni attive

Se l'applicazione richiede dati di sessione permanenti, è consigliabile disabilitare la scalabilità su zero per mantenere la disponibilità di calcolo continua.

Latenza di avvio

Il breve periodo di riattivazione (in genere poche centinaia di millisecondi) può influire sull'esperienza utente per la prima query dopo la sospensione. Per le applicazioni che richiedono tempi di risposta immediati, è possibile:

Disabilitare la scalabilità fino a zero per i computing sempre disponibili
Implementare il riscaldamento delle connessioni a livello di applicazione
Usare periodi di timeout più lunghi per ridurre la frequenza di riattivazione

Comportamento del ramo di produzione

Quando si crea un progetto, il production ramo viene creato con scalabilità su zero disabilitato per impostazione predefinita, ovvero il calcolo rimane sempre attivo. Se necessario, è possibile abilitare la scalabilità su zero per il ramo di produzione.