Condividi tramite


Che cos'è Lakebase?

Importante

Questa funzionalità è disponibile in anteprima pubblica nelle aree seguenti: westus, westus2, eastus, eastus2, centralus, southcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasia. uksouth

Questa pagina presenta Azure Databricks Lakebase, un motore di database OLTP postgres completamente gestito, integrato nella piattaforma data intelligence di Databricks. Un'istanza di database è un tipo di calcolo di Azure Databricks che fornisce l'archiviazione e il calcolo per l'esecuzione di un server Postgres che gestisce più database.

Informazioni generali

Un database OLTP (Online Transaction Processing) è un tipo specializzato di sistema di database progettato per gestire in modo efficiente volumi elevati di dati transazionali in tempo reale. Lakebase consente di creare un database OLTP in Azure Databricks e di integrare carichi di lavoro OLTP con Lakehouse. Questo database OLTP consente di creare e gestire database archiviati nell'archiviazione gestita da Databricks.

L'uso di un database OLTP in combinazione con la piattaforma Azure Databricks riduce significativamente la complessità delle applicazioni. Lakebase è ben integrato con Databricks Feature Store, SQL Warehouse e App Databricks. L'uso delle tabelle di sincronizzazione offre un modo semplice ed efficiente per sincronizzare i dati tra carichi di lavoro OLTP e OLAP (Online Analytical Processing).

Basato su Postgres e completamente integrato con databricks Data Intelligence Platform, Lakebase eredita diverse funzionalità principali della piattaforma, tra cui:

  • Gestione semplificata: Sfrutta l'infrastruttura di Azure Databricks esistente per distribuire istanze con risorse di calcolo e archiviazione disaccoppiate, acquisizione dei dati delle modifiche gestite con Delta Lake e supporto per distribuzioni multi-cloud.
  • Funzionalità integrate di intelligenza artificiale e Machine Learning: Supporta funzionalità e servizio di modelli, generazione aumentata dal recupero (RAG) e altre integrazioni di intelligenza artificiale e Machine Learning.
  • Autenticazione e governance integrate: Facoltativamente, usare Unity Catalog per applicare l'accesso sicuro ai dati.

Caso d'uso di esempio

Gli esempi seguenti illustrano come le organizzazioni in diversi settori usano le integrazioni di Azure Databricks per il processo decisionale in tempo reale e l'automazione del flusso di lavoro:

  • E-commerce: Usare segmenti di clienti pre-calcolati e informazioni dettagliate per supportare flussi di lavoro come la distribuzione preferenziale, la destinazione dell'offerta e le raccomandazioni personalizzate sui prodotti.
  • Sanità: Gestire i dati della sperimentazione clinica e fornire informazioni dettagliate rilevanti tramite i sistemi di raccomandazione incorporati nei flussi di lavoro clinici.
  • Servizi finanziari: Abilitare il trading automatico del mercato in base ai dati di streaming e ai modelli preaddestrati.
  • Commercio al dettaglio: Usare un chatbot che incorpora la cronologia delle conversazioni recenti e i dati in tempo reale (ad esempio, il contenuto del carrello acquisti) per personalizzare le risposte e favorire l'engagement.
  • Manifatturiero: Tenere traccia e gestire i dati di telemetria dei computer e IoT per supportare processi decisionali a bassa latenza e flussi di lavoro di manutenzione automatizzati.

Tipi di carico di lavoro

  • Gestione dei dati: Fornire informazioni dettagliate da tabelle dorate alle applicazioni a bassa latenza e QPS elevato.
  • Archiviare lo stato dell'applicazione: Gestire lo stato del flusso di lavoro nell'archivio dati transazionale.
  • Distribuzione delle Caratteristiche: Fornire dati caratterizzati ai modelli con bassa latenza.

Integrazione di Databricks

Le funzionalità seguenti supportano l'integrazione di Lakebase con le funzionalità di Azure Databricks esistenti:

  • Integrazione dell'archivio funzionalità online: Usare le tabelle PostgreSQL come archivio online per la gestione delle funzionalità in tempo reale. Consultare il Feature Store online di Databricks.
  • Archiviare i dati delle app di Databricks: Aggiungere istanze di database come risorsa dell'app per rendere persistenti i dati nelle distribuzioni di Azure Databricks Apps. Vedere Aggiungere una risorsa Lakebase a un'app Databricks.
  • Risorse dei bundle di asset di Databricks: Definire le istanze del database e le tabelle sincronizzate come risorse in un bundle per gestire progetti complessi. Vedere database_instance e synced_database_table.
  • Integrazione di Databricks Terraform: Usare il provider Databricks Terraform per creare e gestire le risorse lakebase. Terraform consente di automatizzare gli aspetti più complessi della distribuzione e della gestione delle piattaforme dati. Vedi il provider Terraform di Databricks e la documentazione di Terraform.