Udostępnij przez


Co to jest skalowanie automatyczne w usłudze Lakebase?

Ważne

Skalowanie automatyczne bazy danych Lakebase znajduje się w wersji beta w następujących regionach: eastus2, westeurope, westus.

Autoskalowanie bazy danych Lakebase to najnowsza wersja bazy danych Lakebase z automatycznym skalowaniem obliczeniowym, skalowaniem do zera, rozgałęzianiem i natychmiastowym przywracaniem. Aby zapoznać się z porównaniem funkcji z aprowizowaną usługą Lakebase, zobacz wybieranie między wersjami.

Autoskalowanie bazy danych Postgres w usłudze Lakebase to w pełni zarządzana baza danych Postgres zintegrowana z platformą analizy danych usługi Databricks. Oferuje możliwości przetwarzania transakcji online (OLTP) dla Twojej usługi lakehouse, umożliwiając tworzenie aplikacji transakcyjnych w czasie rzeczywistym równolegle z zadaniami analitycznymi.

Skalowanie automatyczne bazy danych Lakebase Postgres łączy niezawodność i znajomość bazy danych Postgres z nowoczesnymi funkcjami bazy danych, takimi jak skalowanie automatyczne, skalowanie do zera, rozgałęzianie i natychmiastowe przywracanie. Te funkcje umożliwiają elastyczne przepływy pracy programowania, ekonomiczne operacje i szybką iterację.

Integracja Lakebase z Unity Catalog i aplikacjami

Sposób organizowania projektów

Zrozumienie hierarchii obiektów lakebase ułatwia organizowanie zasobów i zarządzanie nimi:

Databricks Workspace
  └── Project(s)
      └── Branch(es)
          ├── Compute (primary R/W)
          ├── Read replica(s) (optional)
          ├── Role(s)
          └── Database(s)
                 └── Schema(s)

Każdy poziom w hierarchii służy do określonego celu:

Object Description
Projekt Kontener najwyższego poziomu dla zasobów bazy danych. Projekt zawiera gałęzie, bazy danych, role i zasoby obliczeniowe. Zobacz Zarządzanie projektami.
Gałąź Izolowane środowisko bazy danych, które dzieli pamięć masową z nadrzędną gałęzią. Każdy projekt może zawierać wiele gałęzi. Zobacz Zarządzanie gałęziami.
Środowisko obliczeniowe Serwer Postgres, który obsługuje gałąź. Każda gałąź ma własne obliczenia, które zapewniają moc obliczeniową i pamięć na potrzeby operacji bazy danych. Zobacz Zarządzanie obliczeniami.
Baza danych Standardowa baza danych Postgres w instancji. Każda gałąź może zawierać wiele baz danych z własnymi tabelami, schematami i danymi. Zobacz Zarządzanie bazami danych.

Informacje o gałęziach

Jedną z najbardziej zaawansowanych funkcji bazy danych Lakebase Postgres jest rozgałęzianie. Podobnie jak gałęzie usługi Git dla kodu, gałęzie umożliwiają tworzenie izolowanych środowisk baz danych na potrzeby programowania i testowania — bez wpływu na środowisko produkcyjne.

Dlaczego ma to znaczenie: Tradycyjne przepływy pracy bazy danych wymagają oddzielnych serwerów deweloperskich i przejściowych, ręcznych odświeżeń danych i starannej koordynacji. Za pomocą gałęzi można wykonywać następujące czynności:

  • Natychmiastowe tworzenie środowiska projektowego z danymi produkcyjnymi
  • Bezpieczne testowanie zmian schematu przed ich zastosowaniem do środowiska produkcyjnego
  • Odzyskiwanie po błędach przez tworzenie gałęzi z dowolnego punktu w czasie
  • Płacisz tylko za zmienione dane, a nie pełne zduplikowane bazy danych
Temat Description
Oddziały Dowiedz się, jak gałęzie działają, typowe przepływy pracy i najlepsze rozwiązania dla zespołu.
Zarządzanie oddziałami Tworzenie, resetowanie i usuwanie gałęzi na potrzeby programowania i testowania.
Chronione gałęzie Chroń gałęzie produkcyjne przed przypadkowymi zmianami i usunięciami.

Podstawowe pojęcia

Usługa Lakebase opiera się na kilku kluczowych innowacjach, które odróżniają ją od tradycyjnych systemów baz danych:

  • Oddzielone zasoby obliczeniowe i magazyn: Skalowanie zasobów obliczeniowych niezależnie od magazynu w celu zwiększenia wydajności i elastyczności.
  • Skalowanie automatyczne: Obliczenia są automatycznie dostosowywane na podstawie zapotrzebowania na obciążenie, z obsługą skalowania do zera w okresach bezczynności.
  • Magazyn kopii na zapis: Umożliwia natychmiastowe rozgałęzianie, w którym płacisz tylko za zmiany danych, a nie pełne duplikaty.
  • Natychmiastowe operacje w czasie: Utwórz gałęzie lub przywróć je w dowolnym momencie w skonfigurowanym oknie przywracania (0–30 dni)

Te koncepcje współpracują ze sobą, aby umożliwić elastyczne procesy rozwoju, oszczędne operacje i szybkie odzyskiwanie po błędach.

Aby uzyskać szczegółowe wyjaśnienie poszczególnych podstawowych pojęć, zobacz Podstawowe pojęcia.