Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Importante
La scalabilità automatica di Lakebase si trova in Beta nelle aree seguenti: eastus2, westeurope, westus.
Lakebase Autoscaling è la versione più recente di Lakebase con calcolo autoscalante, riduzione a zero, ramificazione e ripristino istantaneo. Per il confronto delle funzionalità con Lakebase Provisioned, vedere scegliere tra le versioni.
La scalabilità su zero sospende automaticamente il calcolo di Lakebase dopo un periodo di inattività, riducendo al minimo i costi per i database che non sono continuamente attivi. Questa funzionalità è particolarmente utile per gli ambienti di sviluppo, test e gestione temporanea, nonché per i database di produzione con periodi di inattività prevedibili.
Quando la scalabilità su zero è abilitata:
- Il calcolo viene sospeso automaticamente dopo un periodo di inattività (il valore predefinito è 5 minuti, minimo è 60 secondi)
- Si paga solo per il tempo di calcolo attivo, non per i periodi di inattività
- Il calcolo reagisce automaticamente entro poche centinaia di millisecondi quando si esegue una nuova query
Questo diagramma illustra la scalabilità a zero comportamento insieme alla scalabilità automatica, che mostra un periodo di inattività seguito dalla sospensione automatica fino a quando non si accede nuovamente al database.
La scalabilità a zero funziona in modo indipendente dalla scalabilità automatica. Mentre la scalabilità automatica regola le risorse di calcolo durante i periodi attivi in base alla domanda del carico di lavoro, la scalabilità su zero sospende completamente il calcolo durante l'inattività, riducendo i costi di calcolo a zero.
Funzionamento della scalabilità a zero
Sospensione automatica
Quando il calcolo rimane inattivo per il periodo di timeout configurato, senza ricevere query o connessioni, Lakebase lo sospende automaticamente. Durante la sospensione:
- Il calcolo non utilizza risorse e non comporta costi di calcolo
- I dati rimangono archiviati e disponibili in modo sicuro
- Le stringhe di connessione e le credenziali rimangono valide
- L'endpoint di calcolo rimane accessibile ma inattivo
Riattivazione automatica
Quando una nuova query o una nuova richiesta di connessione arriva a un calcolo sospeso, Lakebase la riattiva automaticamente. Processo di riattivazione:
- Non richiede alcun intervento manuale
- Gestisce in modo trasparente la richiesta di connessione una volta attiva
- Ripristina le dimensioni minime configurate del calcolo (se la scalabilità automatica è abilitata)
Le applicazioni devono implementare la logica di ripetizione dei tentativi di connessione per gestire correttamente il breve periodo di riattivazione.
Configurazione del timeout
È possibile configurare il timeout di riduzione a zero per controllare quanto rapidamente le risorse di calcolo si sospendono dopo che sono diventate inattive. Il timeout determina il bilanciamento tra:
- Timeout più brevi (60 secondi - 5 minuti): una sospensione più veloce riduce i costi, ma può causare riattivazioni più frequenti con carichi di lavoro intermittenti
- Timeout più lunghi (5 minuti - 1 ora): meno riattivazioni migliorano l'esperienza dell'utente per attività sporadiche, ma possono aumentare i costi durante i periodi di inattività prolungati
Il timeout minimo è 60 secondi. Il valore massimo è configurabile in base al caso d'uso.
Scalabilità a zero vantaggi
- Riduzione dei costi: Sospendendo i calcoli inattivi, si paga solo per il tempo di utilizzo effettivo. Un database di sviluppo usato 8 ore al giorno costa un terzo del calcolo sempre attivo.
- Distribuzione flessibile: La scalabilità a zero consente la distribuzione conveniente di più ambienti. È possibile gestire ambienti di sviluppo, test, staging e anteprima separati senza incorrere in costi di calcolo 24/7 per ognuno.
- Nessuna gestione manuale: Il sistema gestisce automaticamente la sospensione e la riattivazione, eliminando la necessità di avviare e arrestare manualmente i calcoli in base ai modelli di utilizzo.
- Configurazione mantenuta: Tutte le impostazioni di calcolo, i dettagli di connessione e le configurazioni del database rimangono intatte durante la sospensione. Quando il calcolo reagisce, riprende con la stessa configurazione.
Configurazione della scala a zero
La scalabilità su zero può essere abilitata o disabilitata per qualsiasi calcolo. Se abilitata, si configura il timeout di inattività che attiva la sospensione (il valore predefinito è 5 minuti, minimo è 60 secondi).
Una configurazione comune è che i rami di produzione abbiano la scalabilità su zero disabilitata per la disponibilità continua, mentre i rami di sviluppo hanno la possibilità di ottimizzare i costi.
Per istruzioni dettagliate sulla configurazione delle impostazioni da scala a zero, vedere Gestire i calcoli.
Scenari comuni di scalabilità a zero
Ambienti di sviluppo e test
I rami di sviluppo per testare le modifiche dello schema, convalidare le pipeline di dati o sperimentare nuove funzionalità visualizzano in genere attività intermittenti. La scalabilità su zero sospende automaticamente questi calcoli durante le serate, i fine settimana e tra le sessioni lavorative, riducendo significativamente i costi.
Ambienti di gestione temporanea e anteprima
Gli ambienti di gestione temporanea usati per la convalida pre-distribuzione o gli ambienti di anteprima creati per le richieste pull spesso rimangono inattive tra i cicli di test. La scalabilità su zero garantisce che questi ambienti consumino le risorse solo durante i periodi di test attivi.
Agenti di intelligenza artificiale e applicazioni con periodi di inattività
Gli agenti di intelligenza artificiale, i chatbot o gli strumenti interni che servono ore lavorative specifiche o hanno modelli di tempo di inattività prevedibili possono trarre vantaggio dalla scalabilità a zero. Il calcolo viene sospeso durante gli orari di minore attività e riattiva automaticamente quando gli utenti tornano.
Database dell'applicazione multi-tenant
Le applicazioni che servono più clienti possono usare la scalabilità a zero per i database specifici del tenant. I calcoli per i tenant inattivi si sospendono automaticamente, riducendo i costi di calcolo aggregati tra tutti i tenant.
Considerazioni importanti
Reimpostazione del contesto della sessione
Quando un ambiente di calcolo sospende e successivamente riattiva, il contesto della sessione viene reimpostato. Sono inclusi:
- Statistiche in memoria e contenuto della cache
- Tabelle temporanee e istruzioni preparate
- Impostazioni di configurazione specifiche della sessione
- Pool di connessioni e transazioni attive
Se l'applicazione richiede dati di sessione permanenti, è consigliabile disabilitare la scalabilità su zero per mantenere la disponibilità di calcolo continua.
Latenza di avvio
Il breve periodo di riattivazione (in genere poche centinaia di millisecondi) può influire sull'esperienza utente per la prima query dopo la sospensione. Per le applicazioni che richiedono tempi di risposta immediati, è possibile:
- Disabilitare la scalabilità fino a zero per i computing sempre disponibili
- Implementare il riscaldamento delle connessioni a livello di applicazione
- Usare periodi di timeout più lunghi per ridurre la frequenza di riattivazione
Comportamento del ramo di produzione
Quando si crea un progetto, il production ramo viene creato con scalabilità su zero disabilitato per impostazione predefinita, ovvero il calcolo rimane sempre attivo. Se necessario, è possibile abilitare la scalabilità su zero per il ramo di produzione.
Ridimensionamento a zero e scalabilità automatica
La scalabilità a zero integra la scalabilità automatica per ottimizzare le prestazioni e i costi:
- Durante i periodi attivi: La scalabilità automatica regola le dimensioni di calcolo in base alla domanda di carico di lavoro all'interno dell'intervallo configurato, aumentando le prestazioni durante l'attività elevata e verso il basso durante carichi più leggeri.
- Durante i periodi inattivi: Dopo il timeout di riduzione a zero, il calcolo si sospende completamente e i costi di calcolo diminuiscono a zero indipendentemente dall'intervallo configurato di scalabilità automatica.
- Quando viene riattivata: Il calcolo viene riavviato con le dimensioni minime di scalabilità automatica (se la scalabilità automatica è abilitata) e la scalabilità automatica regola le risorse in base al nuovo carico di lavoro.
Questa combinazione ottimizza l'efficienza: la scalabilità automatica ottimizza l'utilizzo delle risorse durante l'attività, mentre la scalabilità a zero elimina i costi durante l'inattività.
Passaggi successivi
- Gestire i calcoli per informazioni su come configurare le impostazioni di scalabilità a zero
- Dashboard delle metriche per visualizzare il modo in cui le metriche riflettono i periodi di calcolo inattivi
- Scalabilità automatica per comprendere come i calcoli regolano le risorse durante i periodi attivi
- Rami del database per imparare a creare ambienti di database isolati