Condividi tramite


Che cos'è la scalabilità automatica di Lakebase?

Importante

La scalabilità automatica di Lakebase si trova in Beta nelle aree seguenti: eastus2, westeurope, westus.

Lakebase Autoscaling è la versione più recente di Lakebase con calcolo autoscalante, riduzione a zero, ramificazione e ripristino istantaneo. Per il confronto delle funzionalità con Lakebase Provisioned, vedere scegliere tra le versioni.

La scalabilità automatica di Lakebase Postgres è un database Postgres completamente gestito integrato nella piattaforma data intelligence di Databricks. Offre funzionalità di elaborazione delle transazioni online (OLTP) al lakehouse, consentendo di creare applicazioni transazionali in tempo reale insieme ai carichi di lavoro di analisi.

La scalabilità automatica di Lakebase Postgres combina l'affidabilità e la familiarità di Postgres con funzionalità di database moderne, tra cui scalabilità automatica, scalabilità a zero, diramazione e ripristino istantaneo. Queste funzionalità consentono flussi di lavoro di sviluppo flessibili, operazioni efficienti in termini di costi e iterazione rapida.

Integrazione di Lakebase con Unity Catalog e applicazioni

Modalità di organizzazione dei progetti

Comprendere la gerarchia degli oggetti Lakebase consente di organizzare e gestire le risorse:

Databricks Workspace
  └── Project(s)
      └── Branch(es)
          ├── Compute (primary R/W)
          ├── Read replica(s) (optional)
          ├── Role(s)
          └── Database(s)
                 └── Schema(s)

Ogni livello della gerarchia ha uno scopo specifico:

Oggetto Description
Progetto Contenitore di primo livello per le risorse del database. Un progetto contiene rami, database, ruoli e risorse di calcolo. Vedere Gestire i progetti.
Ramo Ambiente di database isolato che condivide l'archiviazione con il ramo padre. Ogni progetto può contenere più rami. Consulta Gestire i rami.
Calcolo Server Postgres che supporta un ramo. Ogni ramo ha un proprio calcolo che fornisce la potenza di elaborazione e la memoria per le operazioni del database. Vedere Gestire i calcoli.
Banca dati Un database Postgres standard all'interno di un ramo. Ogni ramo può contenere più database con tabelle, schemi e dati personalizzati. Vedere Gestire i database.

Informazioni sui rami

Una delle funzionalità più potenti di Lakebase Postgres è la diramazione. Come i rami Git per il codice, i rami consentono di creare ambienti di database isolati per lo sviluppo e il test, senza influire sulla produzione.

Perché questo aspetto è importante: I flussi di lavoro di database tradizionali richiedono server di sviluppo e gestione temporanea separati, aggiornamenti manuali dei dati e un'attenta coordinamento. Con i rami è possibile:

  • Creare immediatamente un ambiente di sviluppo con i dati di produzione
  • Testare le modifiche dello schema in modo sicuro prima di applicarle all'ambiente di produzione
  • Recupera dagli errori creando rami da qualsiasi momento nel tempo
  • Pagate solo per i dati che modificate, non per interi database duplicati
Argomento Description
Filiali Informazioni sul funzionamento dei rami, sui flussi di lavoro comuni e sulle procedure consigliate per il team.
Gestire i rami Creare, reimpostare ed eliminare rami per lo sviluppo e il test.
Rami protetti Proteggere i rami di produzione da modifiche ed eliminazioni accidentali.

Concetti principali

Lakebase si basa su diverse innovazioni chiave che la differenziano dai sistemi di database tradizionali:

  • Calcolo e archiviazione separati: Ridimensionare le risorse di calcolo in modo indipendente dall'archiviazione per ottenere efficienza e flessibilità in termini di costi.
  • Scalabilità automatica: Il calcolo si adatta automaticamente in base alla domanda del carico di lavoro, con il supporto per la scalabilità a zero durante i periodi di inattività.
  • Archiviazione copy-on-write: Consente una rapida diramazione in cui si paga solo per le modifiche ai dati, non per copie complete.
  • Operazioni istantanee puntuali: Crea rami o ripristina in qualsiasi momento nella finestra di ripristino configurata (0-30 giorni)

Questi concetti interagiscono per abilitare flussi di lavoro di sviluppo flessibili, operazioni efficienti in termini di costi e ripristino rapido da errori.

Per una spiegazione dettagliata di ogni concetto di base, vedere Concetti di base.