Udostępnij przez


Co to jest Lakebase?

Ważne

Ta funkcja jest dostępna w wersji próbnej w następujących regionach: westus, westus2, eastus, eastus2, centralus, southcentralus, northeurope, westeurope, australiaeast, brazilsouth, canadacentral, centralindia, southeastasia, uksouth.

Ta strona zawiera wprowadzenie do usługi Azure Databricks Lakebase, w pełni zarządzanego aparatu bazy danych Postgres OLTP zintegrowanego z platformą analizy danych usługi Databricks. Wystąpienie bazy danych to rodzaj obliczeń w usłudze Azure Databricks, który zapewnia przechowywanie i zasoby obliczeniowe do uruchamiania serwera Postgres, zarządzającego wieloma bazami danych.

Przegląd

Baza danych przetwarzania transakcji online (OLTP) to wyspecjalizowany typ systemu bazy danych przeznaczony do wydajnego obsługi dużych ilości danych transakcyjnych w czasie rzeczywistym. Usługa Lakebase umożliwia tworzenie bazy danych OLTP w usłudze Azure Databricks i integrowanie obciążeń OLTP z usługą Lakehouse. Ta baza danych OLTP umożliwia tworzenie baz danych przechowywanych w magazynie zarządzanym przez usługę Databricks i zarządzanie nimi.

Korzystanie z bazy danych OLTP w połączeniu z platformą Azure Databricks znacznie zmniejsza złożoność aplikacji. Usługa Lakebase jest dobrze zintegrowana z magazynem funkcji usługi Databricks, magazynami SQL i aplikacjami usługi Databricks. Korzystanie z tabel synchronizacji zapewnia prosty i wydajny sposób synchronizowania danych między obciążeniami OLTP i przetwarzania analitycznego online (OLAP).

Na bazie Postgresa i w pełni zintegrowany z platformą Databricks Data Intelligence, Lakebase dziedziczy kilka kluczowych funkcji platformy, w tym:

  • Uproszczone zarządzanie: Wykorzystuje istniejącą infrastrukturę usługi Azure Databricks do wdrażania wystąpień z oddzielonymi obliczeniami i magazynem, przechwytywaniem danych zmian zarządzanych za pomocą usługi Delta Lake i obsługą wdrożeń w wielu chmurach.
  • Zintegrowane możliwości sztucznej inteligencji (AI) i uczenia maszynowego (ML): Obsługuje obsługę funkcji i modeli, generację wspomaganą pobieraniem (RAG) oraz inne integracje sztucznej inteligencji i uczenia maszynowego.
  • Zintegrowane uwierzytelnianie i zarządzanie: Opcjonalnie użyj Unity Catalog do wymuszenia bezpiecznego dostępu do danych.

Przykładowe przypadki użycia

W poniższych przykładach pokazano, jak organizacje w różnych branżach korzystają z integracji usługi Azure Databricks na potrzeby podejmowania decyzji w czasie rzeczywistym i automatyzacji przepływu pracy:

  • Handel elektroniczny: Użyj wstępnie obliczonych segmentów klientów i szczegółowych informacji, aby obsługiwać przepływy pracy, takie jak preferencyjne dostarczanie, określanie oferty i spersonalizowane rekomendacje dotyczące produktów.
  • Opieka zdrowotna: Zarządzanie danymi badań klinicznych i uzyskiwanie odpowiednich wniosków za pomocą systemów rekomendacji osadzonych w klinicznych przepływach pracy.
  • Usługi finansowe: Umożliwia automatyczne handel na rynku na podstawie danych przesyłanych strumieniowo i wstępnie wytrenowanych modeli.
  • Handel detaliczny: Użyj czatbota, który zawiera najnowszą historię konwersacji i dane w czasie rzeczywistym (na przykład zawartość koszyka), aby personalizować odpowiedzi i zwiększać zaangażowanie.
  • Produkcja: Śledzenie i zarządzanie telemetrią maszyn oraz danymi IoT w celu wspierania podejmowania decyzji w czasie rzeczywistym oraz zautomatyzowanych procesów konserwacji.

Typy obciążeń

  • Obsługa danych: Obsługa szczegółowych informacji ze złotych tabel do aplikacji z małym opóźnieniem i wysokim poziomem QPS.
  • Stan aplikacji sklepu: Zarządzanie stanem przepływu pracy w naszym transakcyjnym magazynie danych.
  • Serwowanie funkcji: Podawanie sfunkcjonalizowanych danych do modeli z niskim opóźnieniem.

Integracja z usługą Databricks

Następujące możliwości obsługują integrowanie usługi Lakebase z istniejącymi możliwościami usługi Azure Databricks:

  • Integracja magazynu funkcji online: Użyj tabel PostgreSQL jako magazynu online do obsługi funkcji w czasie rzeczywistym. Zobacz Repozytoria funkcji online Databricks.
  • Przechowywanie danych Azure Databricks Apps: Dodaj wystąpienia bazy danych jako zasób aplikacji, aby przechowywać dane we wdrożeniach Azure Databricks Apps. Zobacz Dodaj zasób Lakebase do aplikacji Databricks.
  • Zasoby pakietu zasobów usługi Databricks: Zdefiniuj wystąpienia bazy danych i zsynchronizowane tabele jako zasoby w pakiecie, aby ułatwić zarządzanie złożonymi projektami. Zobacz database_instance i synced_database_table.
  • Integracja narzędzia Terraform z usługą Databricks: Użyj dostawcy narzędzia Terraform usługi Databricks, aby utworzyć zasoby usługi Lakebase i zarządzać nimi. Narzędzie Terraform pozwala zautomatyzować najbardziej skomplikowane aspekty wdrażania platform danych i zarządzania nimi. Zobacz dostawcę Terraform dla Databricks i dokumentację Terraform.