Udostępnij przez


Autoscaling

Ważne

Skalowanie automatyczne bazy danych Lakebase znajduje się w wersji beta w następujących regionach: eastus2, westeurope, westus.

Autoskalowanie bazy danych Lakebase to najnowsza wersja bazy danych Lakebase z automatycznym skalowaniem obliczeniowym, skalowaniem do zera, rozgałęzianiem i natychmiastowym przywracaniem. Aby zapoznać się z porównaniem funkcji z Lakebase Provisioned, sprawdź wybieranie między wersjami.

Skalowanie automatyczne dynamicznie dostosowuje ilość zasobów obliczeniowych przydzielonych do zasobów obliczeniowych usługi Lakebase w odpowiedzi na bieżące wymagania dotyczące obciążeń. Ponieważ aplikacja doświadcza różnych poziomów aktywności w ciągu dnia, skalowanie automatyczne automatycznie zwiększa wydajność obliczeniową podczas szczytowego użycia i zmniejsza je w cichszych okresach, eliminując konieczność ręcznej interwencji.

Ta wizualizacja pokazuje, jak działa skalowanie automatyczne przez typowy dzień, a zasoby obliczeniowe są skalowane w górę lub w dół na podstawie zapotrzebowania, aby zapewnić, że baza danych ma zasoby, których potrzebuje, jednocześnie oszczędzając zasoby poza szczytem.

Wizualizacja skalowania automatycznego

Skalowanie automatyczne działa w zakresie zdefiniowanym przez użytkownika. Można na przykład ustawić obliczenia w celu skalowania między 2 i 8 jednostkami obliczeniowymi (CU), a każda jednostka CU zapewnia 2 GB pamięci RAM. Zasoby obliczeniowe są automatycznie dostosowywane w ramach tych limitów na podstawie obciążenia, nigdy nie spadając poniżej minimum ani nie przekraczając maksymalnego poziomu, niezależnie od zapotrzebowania. Skalowanie automatyczne jest dostępne dla jednostek obliczeniowych do 32 CU.

Uwaga / Notatka

Lakebase Provisioned vs Autoscaling: W trybie Lakebase Provisioned każda jednostka obliczeniowa przydziela około 16 GB pamięci RAM. W usłudze Lakebase Autoscaling każdy CU przydziela 2 GB pamięci RAM. Ta zmiana zapewnia bardziej szczegółowe opcje skalowania i kontrolę kosztów.

Jak działa skalowanie automatyczne

Automatyczne dostosowanie zasobów

Po włączeniu skalowania automatycznego i ustawieniu minimalnych i maksymalnych rozmiarów obliczeniowych usługa Lakebase stale monitoruje obciążenie i automatycznie dostosowuje zasoby. System śledzi trzy kluczowe metryki, aby podejmować decyzje dotyczące skalowania:

  • Obciążenie procesora CPU: Monitoruje wykorzystanie procesora, aby upewnić się, że baza danych ma odpowiednią moc obliczeniową.
  • Użycie pamięci: Śledzi użycie pamięci RAM, aby zapobiec ograniczeniom pamięci.
  • Rozmiar zestawu roboczego: Szacuje często używane dane w celu zoptymalizowania wydajności pamięci podręcznej.

Na podstawie tych metryk, Lakebase skaluje obliczenia w górę, gdy zapotrzebowanie rośnie, i skaluje w dół, gdy aktywność maleje, wszystko to w ramach skonfigurowanego zakresu.

Skalowanie granic

Zakres skalowania definiuje się przez ustawienie minimalnych i maksymalnych rozmiarów obliczeniowych. Ten zakres zapewnia:

  • Gwarancje wydajności: Minimum zapewnia wydajność punktu odniesienia nawet podczas niskiej aktywności.
  • Kontrola kosztów: Wartość maksymalna uniemożliwia niezwiązane użycie zasobów i koszty.
  • Automatyczna optymalizacja: W tych granicach usługa Lakebase obsługuje wszystkie decyzje dotyczące skalowania.

Różnica między maksymalną i minimalną wartością nie może przekraczać 8 cu (czyli max - min ≤ 8 CU).

Brak przestoju ani interwencji ręcznej

Korekty skalowania automatycznego są wykonywane bez konieczności ponownego uruchamiania zasobów obliczeniowych lub przerw w działaniu połączenia. Po skonfigurowaniu system działa autonomicznie, co pozwala skoncentrować się na aplikacjach, a nie na zarządzaniu infrastrukturą.

Korzyści z skalowania automatycznego

Efektywność kosztowa: Płacisz tylko za zasoby obliczeniowe, z których rzeczywiście korzystasz. W godzinach poza szczytem zasoby obliczeniowe są skalowane w dół, co zmniejsza koszty. Podczas okresów szczytowych zwiększa się skalę, aby utrzymać wydajność.

Optymalizacja wydajności: Baza danych automatycznie odbiera dodatkowe zasoby, gdy zwiększa się obciążenie, zapobiegając pogorszeniu wydajności podczas skoków ruchu lub intensywnych operacji.

Przewidywalne koszty: Ustawiając maksymalny rozmiar zasobów obliczeniowych, kontrolujesz górną granicę kosztów obliczeniowych, zapobiegając nieoczekiwanym wydatkom związanym z nadmiernym zużyciem zasobów.

Uproszczone operacje: Skalowanie automatyczne eliminuje konieczność ręcznego monitorowania wzorców obciążeń i dostosowywania rozmiarów obliczeń, zmniejszając nakład pracy operacyjnej i ryzyko wystąpienia błędu ludzkiego.

Konfigurowanie skalowania automatycznego

Konfiguracja skalowania automatycznego wymaga ustawienia minimalnych i maksymalnych granic rozmiaru obliczeniowego. Skalowanie automatyczne jest dostępne dla jednostek obliczeniowych do 32 CU. W przypadku obciążeń wymagających więcej niż 32 jednostki obliczeniowe (CU) dostępne są większe jednostki obliczeniowe o stałym rozmiarze od 36 CU do 112 CU.

Aby uzyskać szczegółowe instrukcje dotyczące włączania i konfigurowania skalowania automatycznego, zobacz Zarządzanie obliczeniami.

Typowe scenariusze skalowania automatycznego

Obciążenia agentów i aplikacji sztucznej inteligencji

Agenci sztucznej inteligencji i interaktywne aplikacje oparte na usłudze Databricks często doświadczają wzorców żądań zmiennych. Skalowanie automatyczne zapewnia, że baza danych obsługuje skoki ruchu podczas aktywnych sesji użytkowników, jednocześnie zmniejszając koszty w cichych okresach.

Środowiska programistyczne i testowe

Gałęzie programistyczne do testowania zmian schematu lub walidacji potoków danych są wykorzystywane do sporadycznych działań. Skalowanie automatyczne minimalizuje zasoby w okresach bezczynności przy jednoczesnym zapewnieniu odpowiedniej wydajności podczas aktywnego programowania.

Pulpity nawigacyjne i aplikacje dostępne dla klientów

Aplikacje dostarczające analizy lub szczegółowe informacje operacyjne użytkownikom końcowym często mają wzorce użycia w ciągu dnia. Autoskalowanie automatycznie dostosowuje zasoby tak, aby odpowiadały aktywności użytkownika przez cały dzień.

Skalowanie automatyczne i skalowanie do zera

Skalowanie automatyczne działa w połączeniu ze skalowaniem do zera. Skalowanie automatyczne dostosowuje zasoby na podstawie zapotrzebowania na obciążenie, ale skalowanie do zera powoduje wstrzymanie obliczeń całkowicie po okresie braku aktywności, co zmniejsza koszty obliczeń do zera w okresach bezczynności.

Podczas konfigurowania obu funkcji:

  1. Aktywny okres: Skalowanie automatyczne dostosowuje rozmiar obliczeniowy na podstawie obciążenia w zdefiniowanym zakresie.
  2. Okres nieaktywny: Po przekroczeniu limitu czasu skalowania do zera obliczenia są w całości zawieszone.
  3. Wznowione działanie: Obliczenia są uruchamiane ponownie przy minimalnym rozmiarze skalowania automatycznego po nadejściu nowych zapytań.

Ta kombinacja maksymalizuje efektywność kosztową, szczególnie w przypadku środowisk programistycznych, testowych lub przejściowych, które mają długie okresy bezczynności.

Dalsze kroki