Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Lakebase Provisioned è l'offerta originale di Lakebase che utilizza calcolo provisionato che puoi scalare manualmente. Per le aree supportate, vedere Disponibilità dell'area. Per la versione più recente di Lakebase, con calcolo con scalabilità automatica, scala-a-zero, branching e ripristino istantaneo, vedere Lakebase Autoscaling.
Dal 12 marzo 2026, le nuove istanze di Lakebase vengono create come progetti di scalabilità automatica. Le istanze con provisioning esistenti vengono aggiornate automaticamente alla scalabilità automatica, a partire da giugno 2026. Per informazioni dettagliate, vedere Eseguire l'aggiornamento alla scalabilità automatica di Lakebase.
Lakebase è un motore di database OLTP (Online Transaction Processing) completamente gestito di Postgres integrato nella piattaforma data intelligence di Databricks. Lakebase consente di creare e gestire database OLTP archiviati nell'archiviazione gestita da Databricks, integrandosi con Lakehouse per carichi di lavoro transazionali in tempo reale.
Architettura dell'istanza di database
Un'istanza del database gestisce le risorse di archiviazione e di calcolo e fornisce gli endpoint a cui gli utenti si connettono.
- Nodi di calcolo: Un nodo è il primario, che gestisce le operazioni di scrittura. I nodi secondari sono facoltativi, separati tra zone per la disponibilità elevata. I nodi di calcolo possono essere sospesi, mantenendo l'archiviazione durante l'interruzione delle risorse di calcolo.
- Endpoint: L'endpoint predefinito indirizza le richieste di lettura e scrittura al nodo primario. Gli endpoint di sola lettura facoltativi instradano ai nodi secondari.
- Gestione degli errori: Se il nodo primario ha esito negativo e viene configurata la disponibilità elevata , un nodo secondario assume automaticamente il controllo.
Limitations
- Un'area di lavoro consente un massimo di dieci istanze.
- Ogni istanza supporta fino a 1000 connessioni simultanee.
- Il limite di dimensioni logiche per tutti i database in un'istanza è di 2 TB.
- Le istanze del database hanno come ambito una singola area di lavoro e non supportano l'accesso tra aree di lavoro.
- Databricks consiglia di configurare il collegamento privato come procedura consigliata per la sicurezza.
Informazioni su Lakebase Provisioning
| Argomento | Description |
|---|---|
| Eseguire l'aggiornamento alla scalabilità automatica | Informazioni sull'aggiornamento delle istanze di Lakebase Provisioned alla piattaforma di scalabilità automatica, incluse le modifiche e le azioni da eseguire (se presenti). |
| Ruoli Postgres | Comprendere i ruoli predefiniti e come gestire i ruoli per le identità di Databricks. |
| Compatibilità di PostgreSQL | Informazioni su compatibilità, limitazioni e suggerimenti per l'ottimizzazione di PostgreSQL. |
Inizia con Lakebase Provisioned
Per i proprietari e gli amministratori del database
Se si configura un nuovo database Lakebase per il team:
| Task | Description |
|---|---|
| Crea un'istanza del database | Configurare il primo database Lakebase con provisioning effettuato. |
| Aggiungere utenti e impostare le autorizzazioni | Concedere ad altri utenti l'accesso al database e controllare le operazioni che possono eseguire. |
Per gli utenti del database
Se è necessario accedere a un database Lakebase esistente:
| Task | Description |
|---|---|
| Connettersi al database | Ottenere le credenziali necessarie per accedere al database Lakebase. |
| Effettua una query sui dati | Usare vari strumenti per eseguire query sui dati PostgreSQL, tra cui l'editor SQL, i notebook e il client psql. |
Integrazione e sincronizzazione dei dati
Connettere Lakebase ai dati e ai flussi di lavoro di Databricks esistenti.
| Argomento | Description |
|---|---|
| Registrati con Unity Catalog | Facoltativamente, registrare il database PostgreSQL come catalogo in Unity Catalog per le query federate. |
| Gestire i dati lakehouse con tabelle sincronizzate | Creare tabelle sincronizzate per gestire i dati di Unity Catalog tramite l'istanza del database Lakebase per le applicazioni operative. |
Funzionalità avanzate
Esplorare le funzionalità avanzate per i carichi di lavoro di produzione e i casi d'uso aziendali.
| Argomento | Description |
|---|---|
| Ripristino dei dati e del tempo di viaggio | Usare le istanze figlio per eseguire spostamenti temporali e ripristinare i dati in punti specifici nel tempo per il ripristino dei dati, il controllo della conformità e gli ambienti di sviluppo. |
| Monitoraggio e osservabilità | Monitorare le prestazioni e l'integrità del database usando metriche e registrazione predefinite. |
Configurazione avanzata
Esplorare le funzionalità avanzate per i carichi di lavoro di produzione e i casi d'uso aziendali.
| Argomento | Description |
|---|---|
| Disponibilità elevata | Configurare la disponibilità elevata per le istanze del database per garantire la continuità aziendale. |
| Finestra di ripristino | Impostare la finestra di ripristino per l'istanza del database per il ripristino temporizzato. |
Disponibilità a livello di area
Regioni supportate:
westuswestus2eastuseastus2centralussouthcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasiauksouth
Confronto delle funzionalità
La tabella seguente confronta le funzionalità in Lakebase Autoscaling e Lakebase Provisioned.
Note
Lakebase Autoscaling è la nuova versione di Lakebase. Lo sviluppo di nuove funzionalità è incentrato sulla scalabilità automatica di Lakebase.
Le nuove istanze di Lakebase verranno create come progetti di scalabilità automatica. L'implementazione inizia il 12 marzo 2026. Per informazioni dettagliate, vedere Scalabilità automatica per impostazione predefinita.
| Feature | Autoscaling | Sottoposto a provisioning |
|---|---|---|
| Funzionalità principali | ||
| Calcolo allocato (a dimensione fissa) | ✓ | ✓ |
| Autoscaling | ✓ | |
| Ridimensionamento a zero | ✓ | |
| Diramazione | ✓ | |
| Ripristino istantaneo | ✓ | |
| Ripristino temporizzato | ✓ | ✓ |
| Repliche di lettura/repliche secondarie leggibili | ✓ (repliche di lettura, repliche secondarie leggibili) | ✓ (repliche secondarie leggibili) |
| Disponibilità elevata | ✓ | ✓ |
| Collegamento privato in ingresso | ✓ | ✓ |
| Collegamento privato in entrata per servizi ad alte prestazioni | ✓ | |
| Profilo di sicurezza della conformità | ✓ (impostato su HIPAA, C5, TISAX o Nessuno) | |
| Chiavi gestite dal cliente (CMK) | ✓ | |
| Integrazioni dei dati | ||
| Registrazione del catalogo Unity | ✓ | ✓ |
| Tabelle sincronizzate (caricare i dati del lakehouse con Lakebase) | ✓ | ✓ |
| Lakehouse Sync (sincronizzare le tabelle Lakebase con tabelle Delta/Iceberg) | ✓ Anteprima pubblica | |
| Federazione di query | ✓ | ✓ |
| Integrazioni di applicazioni | ||
| Applicazioni Databricks | ✓ | ✓ |
| Feature Store (archivio di funzionalità per machine learning) | ✓ | ✓ |
| Notebooks | ✓ | ✓ |
| Agenti di intelligenza artificiale con stato | ✓ | ✓ |
| Controllo di accesso | ||
| Interfaccia utente per la gestione dei ruoli Postgres | ✓ | ✓ |
| ACL delle aree di lavoro | ✓ | ✓ |
| Strumenti di sviluppo | ||
| Infrastruttura come codice (Asset Bundles, Terraform) | ✓ (beta) | ✓ |
| Accesso a livello di codice (API REST, interfaccia della riga di comando, SDK) | ✓ (beta) | ✓ |
| Supporto dell'API PostgREST | ✓ ( API dati compatibile con PostgREST) | ✓ (anteprima privata) |
| Gestione costi | ||
| Tag e criteri di utilizzo serverless | ✓ | ✓ |