Automatyczne skalowanie w Azure App Service

Uwaga

Automatyczne skalowanie jest dostępne dla wszystkich typów aplikacji: Windows i Linux (wdrażanie jako kod lub kontener).
Automatyczne skalowanie nie jest obsługiwane w przypadku ruchu w gnieździe wdrożeniowym.

Automatyczne skalowanie to funkcja skalowania horyzontalnego, która automatycznie podejmuje decyzje skalowania dla Twoich aplikacji internetowych i planów usługi App Service. Różni się on od Azure autoskalowania, który umożliwia definiowanie reguł skalowania na podstawie metryk i harmonogramów.

Dzięki automatycznemu skalowaniu można dostosować ustawienia skalowania, aby zwiększyć wydajność i zmniejszyć opóźnienia zimnego startu. Platforma podgrzewa instancje, aby działały jako bufor, zapewniając płynne przejścia skalowania. Opłaty są naliczane za sekundę dla każdego wystąpienia, w tym wystąpień wstępnych.

Zanim rozpoczniesz

Automatyczne skalowanie w usłudze App Service różni się od automatycznego skalowania.
Użyj automatycznego skalowania, jeśli chcesz, aby usługa App Service obsługiwała skalowanie automatycznie na podstawie ruchu HTTP bez tworzenia reguł ani harmonogramów.

Automatyczne skalowanie (ten artykuł):

Skaluje się automatycznie na podstawie przychodzącego ruchu HTTP
Skonfigurowane dla każdej aplikacji
Obsługuje Zawsze gotowy, limity na aplikację, Maksymalne nagłe zwiększenie i Przedwstawione wystąpienia.

Autoskalowanie:

Używa metryk (procesor CPU, pamięć, długość kolejki, metryki niestandardowe)
Obsługuje skalowanie oparte na harmonogramie
Dotyczy całego planu usługi App Service

Jeśli potrzebujesz skalowania opartego na CPU, pamięci lub czasie, użyj automatycznego skalowania.
Tylko jedna metoda skalowania powinna być aktywna dla planu usługi App Service.

Opcje skalowania poziomego dostępne w usłudze App Service

	Instrukcja	Automatyczne skalowanie	Automatyczne skalowanie
Dostępne poziomy	Podstawowa i w górę	Standard i wyżej	Premium v2 — wersja 4
Skalowanie oparte na regułach	Nie.	Tak	Nie (oparty na ruchu ulicznym)
Skalowanie oparte na harmonogramie	Nie.	Tak	Nie.
Zawsze gotowe wystąpienia	Nie.	Nie.	Tak (minimum 1)
Instancje wcześniej uruchomione	Nie.	Nie.	Tak (wartość domyślna 1)
Maksimum dla każdej aplikacji	Nie.	Nie.	Tak
Zachowanie koligacji ARR	Domyślnie włączona	Włączone, chyba że ręcznie wyłączone	Należy wyłączyć ręcznie

Jak działa automatyczne skalowanie

Włączasz automatyczne skalowanie dla planu App Service i konfigurujesz zakres wystąpień dla każdej z aplikacji webowych. Gdy aplikacja internetowa zacznie odbierać ruch HTTP, usługa App Service monitoruje obciążenie i dodaje wystąpienia. Zasoby mogą być współużytkowane, gdy wiele aplikacji internetowych w ramach planu usługi App Service musi być jednocześnie skalowanych w poziomie.

Oto kilka scenariuszy, w których należy automatycznie zwiększać skalę:

Nie chcesz konfigurować reguł autoskalowania na podstawie metryk zasobów.
Chcesz, aby aplikacje internetowe w ramach tego samego planu usługi App Service skalowały się inaczej i niezależnie od siebie.
Aplikacja internetowa jest połączona z bazą danych lub starszym systemem, który może nie być skalowany tak szybko, jak aplikacja internetowa. Skalowanie automatycznie umożliwia ustawienie maksymalnej liczby wystąpień, na które można skalować plan usługi App Service. To ustawienie pomaga aplikacji internetowej nie przeciążać zaplecza.

Włączanie automatycznego skalowania

Ustawienie Maksymalny wzrost chwilowy reprezentuje największą liczbę instancji, do której plan usługi App Service może zwiększyć w odpowiedzi na przychodzące żądania HTTP. W przypadku planów Premium v2, v3 i v4 można określić maksymalnie 30 wystąpień. Maksymalna liczba wybuchów musi być równa lub większa niż liczba pracowników określonych dla planu usługi App Service.

Portal Azure
Azure CLI

Aby włączyć automatyczne skalowanie, przejdź do menu po lewej stronie aplikacji internetowej. W obszarze Ustawienia wybierz pozycję Skalowanie w poziomie (plan usługi App Service). Wybierz Automatyczne, zaktualizuj wartość Maksymalny rozbłysk, i wybierz przycisk Zapisz.

Zrzut ekranu przedstawiający automatyczne skalowanie w serwisie Azure

Następujące polecenie włącza automatyczne skalowanie dla istniejącego planu usługi App Service i aplikacji internetowych w ramach tego planu:

az appservice plan update --name <APP_SERVICE_PLAN> --resource-group <RESOURCE_GROUP> --elastic-scale true --max-elastic-worker-count <YOUR_MAX_BURST>

Uwaga

Jeśli zostanie wyświetlony komunikat Operation returned an invalid status 'Bad Request'o błędzie , spróbuj użyć innej grupy zasobów lub utworzyć nową.

Ustawianie minimalnej liczby wystąpień aplikacji internetowej

Ustawienie na poziomie aplikacji Zawsze gotowe wystąpienia określa minimalną liczbę wystąpień. Jeśli obciążenie przekroczy minimalną liczbę ustawioną w zawsze gotowych wystąpieniach, zostaną dodane dodatkowe wystąpienia, aż do określonej wartości maksymalnego przyrostu dla planu App Service.

Portal Azure
Azure CLI

Aby ustawić minimalną liczbę wystąpień aplikacji internetowej, przejdź do menu po lewej stronie aplikacji internetowej i wybierz Skalowanie (plan App Service). Zaktualizuj wartość Zawsze gotowe wystąpienia i wybierz przycisk Zapisz .

Zrzut ekranu ukazujący wystąpienia zawsze gotowe.

Aby ustawić minimalną liczbę wystąpień aplikacji internetowej, użyj następującego polecenia:

 az webapp update --resource-group <RESOURCE_GROUP> --name <APP_NAME> --minimum-elastic-instance-count <ALWAYS_READY_COUNT>

Ustawianie maksymalnej liczby wystąpień aplikacji internetowej

Maksymalna wartość limitu skalowania ustawia maksymalną liczbę wystąpień, do których aplikacja internetowa może być skalowana. Maksymalny limit skalowania jest przydatny, gdy składnik podrzędny, taki jak baza danych, ma ograniczoną przepływność. Maksymalna wartość dla aplikacji może należeć do zakresu od 1 do maksymalnej wartości serii.

Portal Azure
Azure CLI

Aby ustawić maksymalną liczbę wystąpień aplikacji internetowej, przejdź do menu po lewej stronie aplikacji internetowej i wybierz pozycję Skaluj w poziomie (plan usługi App Service). Wybierz opcję Wymuś limit skalowania, zaktualizuj maksymalny limit skalowania, a następnie naciśnij przycisk Zapisz.

Zrzut ekranu przedstawiający maksymalny limit skali.

Aktualizacja wstępnie uruchomionych wystąpień

Ustawienie wstępnie podgrzanej instancji zapewnia rozgrzane instancje jako bufor podczas skalowania i zdarzeń aktywacji HTTP. Prewarmed instancje będą buforować dane aż do osiągnięcia maksymalnego limitu skalowania. Domyślna liczba wstępnie utworzonych wystąpień to 1, a w większości scenariuszy ta wartość powinna pozostawać jako 1.

Portal Azure
Azure CLI

Nie można zmienić ustawienia wystąpienia przygotowanego w portalu. Zamiast tego należy użyć Azure CLI.

Możesz zmodyfikować liczbę wstępnie utworzonych wystąpień dla aplikacji przy użyciu Azure CLI.

 az webapp update --resource-group <RESOURCE_GROUP> --name <APP_NAME> --prewarmed-instance-count <PREWARMED_COUNT>

Aby wyłączyć automatyczne skalowanie, przejdź do menu po lewej stronie aplikacji internetowej i wybierz pozycję Rozszerzenie poziome (plan usługi App Service). Wybierz pozycję Ręczne i wybierz przycisk Zapisz .

Zrzut ekranu przedstawiający ręczne skalowanie.

Następujące polecenie wyłącza automatyczne skalowanie dla istniejącego planu usługi App Service i wszystkich aplikacji internetowych w ramach tego planu:

az appservice plan update --resource-group <RESOURCE_GROUP> --name <APP_SERVICE_PLAN> --elastic-scale false

Często zadawane pytania

Czy automatyczne skalowanie obsługuje aplikacje Azure Functions?

Nie, możesz mieć tylko aplikacje internetowe Azure App Service w planie App Service, w którym chcesz włączyć automatyczne skalowanie. W przypadku aplikacji Azure Functions zalecamy użycie planu Azure Functions Premium.

Uwaga

Automatyczne skalowanie jest wyłączone, gdy aplikacje internetowe usługi App Service i aplikacje Azure Functions znajdują się w tym samym planie usługi App Service.

Jak automatyczne skalowanie działa w tle?

Aplikacje skonfigurowane do automatycznego skalowania są stale monitorowane, a oceny stanu pracowników są przeprowadzane co najmniej raz na każdą kilka sekund. Jeśli system wykryje zwiększone obciążenie aplikacji, kontrole kondycji stają się częstsze. Jeśli zdrowie pracowników się pogarsza i żądania zwalniają, wymagane są inne środki. Szybkość dodawania wystąpień zależy od wzorca obciążenia i czasu uruchamiania poszczególnych aplikacji. Aplikacje z krótkim czasem uruchamiania i sporadycznymi wzrostami obciążenia mogą widzieć jedną maszynę wirtualną dodaną co kilka sekund do minuty.

Po ustąpieniu obciążenia platforma inicjuje przegląd potencjalnego skalowania. Ten proces zwykle rozpoczyna się około 5–10 minut po zatrzymaniu wzrostu obciążenia. Podczas skalowania w dół, wystąpienia są usuwane z maksymalną szybkością jedno co kilka sekund do minuty.

Jeśli wiele aplikacji internetowych jest wdrażanych w ramach tego samego planu App Service, platforma próbuje przydzielić zasoby w dostępnych instancjach. Ta alokacja jest oparta na obciążeniu poszczególnych aplikacji internetowych.

Jak są naliczane opłaty za wstępnie uruchomione instancje?

Aby zrozumieć, jak są naliczane opłaty za wystąpienia przedwzroczone, rozważmy ten scenariusz: Załóżmy, że aplikacja internetowa ma pięć wystąpień, które są zawsze gotowe, wraz z jednym wstępnie ustawionym wystąpieniem jako domyślnym.

Gdy aplikacja internetowa jest bezczynna i nie odbiera żadnych żądań HTTP, jest uruchamiana z pięcioma zawsze gotowymi wystąpieniami. W tym czasie nie są naliczane opłaty za instancje przedwarmowane, ponieważ instancje zawsze dostępne nie są używane, a tym samym nie są przydzielane żadne przedwarmowane instancje.

Jednak jak tylko Twoja aplikacja internetowa zacznie odbierać żądania HTTP i pięć zawsze gotowych wystąpień się aktywuje, zostaje przydzielone wstępnie przygotowane wystąpienie. Rozliczenie za to zaczyna się od tego momentu.

Jeśli szybkość żądań HTTP nadal wzrasta, a usługa App Service zdecyduje się skalować poza początkowe pięć wystąpień, zacznie korzystać z wstępnie uruchomionego wystąpienia. Oznacza to, że gdy istnieje sześć aktywnych wystąpień, siódme wystąpienie jest natychmiast udostępniane, aby wypełnić bufor wstępnego przygotowania.

Ten proces skalowania i przygotowania wstępnego jest kontynuowany do momentu osiągnięcia maksymalnej liczby instancji dla aplikacji. Należy pamiętać, że żadne wystąpienia nie są wstępnie uruchamiane ani aktywowane poza maksymalną liczbą wystąpień.

Dlaczego wpisy `AppServiceHTTPLogs` w dzienniku są podobne do wpisów `/admin/host/ping` ze statusem 404?

Automatyczne skalowanie usługi App Service okresowo sprawdza /admin/host/ping punkt końcowy wraz z innymi mechanizmami kontroli kondycji, które są wbudowane w platformę. Czasami, ze względu na istniejące konfiguracje platformy, te pingi mogą zwracać błędy 404. Należy jednak pamiętać, że te błędy 404 nie powinny mieć wpływu na dostępność aplikacji ani wydajność skalowania.

Jeśli aplikacja internetowa zwróci status 5xx, polecenia ping punktu końcowego mogą prowadzić do sporadycznych ponownych uruchomień, chociaż ten scenariusz jest nietypowy. Upewnij się, że aplikacja internetowa nie zwraca stanu 5xx w tym punkcie końcowym. Nie można dostosować tych punktów końcowych polecenia ping.

Jak śledzić liczbę wystąpień skalowanych w poziomie podczas automatycznego skalowania zdarzenia?

AutomaticScalingInstanceCount Metryka zgłasza liczbę maszyn wirtualnych, na których działa aplikacja, w tym instancję wstępnie zainicjowaną, jeśli została wdrożona. Ta metryka może również służyć do śledzenia maksymalnej liczby wystąpień, na które aplikacja internetowa została rozbudowana podczas automatycznego procesu skalowania. Ta metryka jest dostępna tylko dla aplikacji z włączonym automatycznym skalowaniem .

Jak koligacja ARR wpływa na automatyczne skalowanie?

Uwaga

Po włączeniu automatycznego skalowania w planie usługi App Service wszystkie istniejące już aplikacje w planie będą automatycznie posiadać wyłączoną koligację ARR.

Azure App Service używa ciasteczek routingu zapytań aplikacji, znanych jako afinityzacja ARR. Pliki cookie powiązania ARR ograniczają skalowanie, ponieważ wysyłają żądania tylko do serwerów skojarzonych z plikiem cookie, zamiast do dowolnej dostępnej instancji. W przypadku aplikacji, które przechowują stan, lepiej jest skalować w górę (przydzielić więcej zasobów na jednej instancji). W przypadku aplikacji bezstanowych skalowanie w górę (dodawanie większej liczby wystąpień) zapewnia większą elastyczność i skalowalność. Pliki cookie ARR Affinity są domyślnie włączone w usłudze App Service. Jednak w przypadku korzystania z automatycznego skalowania należy wyłączyć pliki cookie koligacji ARR, aby zapewnić odpowiednie skalowanie.

Aby wyłączyć pliki cookie koligacji ARR: wybierz aplikację usługi App Service, a następnie w obszarze Ustawienia wybierz pozycję Konfiguracja. Następnie wybierz kartę Ustawienia ogólne . W obszarze Koligacja sesji wybierz pozycję Wyłączone , a następnie wybierz przycisk Zapisz .

Dlaczego plan usługi App Service pokazuje więcej przypisanych wystąpień niż zawsze gotowe ustawienia w moich aplikacjach?

Może się tak zdarzyć, gdy przypisanych wystąpień planu jest więcej niż największa liczba dostępnych wystąpień używanych przez dowolną aplikację w planie. Przypisane wystąpienia reprezentują minimalną liczbę wystąpień, które musi uruchomić plan. Jeśli ta wartość jest wyższa niż zawsze gotowe wartości, plan nadal używa tego minimum.

Aby poprawić tę konfigurację, zaktualizuj zawsze gotową liczbę wystąpień dla dowolnej aplikacji w planie. Musisz zmienić wartość. Zapisanie tej samej wartości nie powoduje ponownego obliczenia. Po aktualizacji plan ustawia przypisaną liczbę wystąpień na najwyższą zawsze gotową wartość dla wszystkich aplikacji w planie.

Tę aktualizację należy wykonać przy użyciu interfejsu API CLI lub interfejsu API Azure Resource Manager. Portal Azure nie stosuje obecnie poprawnie ponownego przeliczania.

Przykład: Plan może mieć 7 przypisanych wystąpień. Aplikacje w planie mogą mieć zawsze gotowe wartości 2, 3 i 5. Rozliczenia są oparte na wartości 7, ponieważ jest to minimalna liczba wystąpień. Jeśli zmienisz zawsze gotową wartość aplikacji, na przykład z 3 do 4, plan zostanie ponownie obliczony. Następnie ustawia przypisaną liczbę wystąpień na 5, która jest najwyższą zawsze gotową wartością.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-16

Automatyczne skalowanie w Azure App Service

Zanim rozpoczniesz

Opcje skalowania poziomego dostępne w usłudze App Service

Jak działa automatyczne skalowanie

Włączanie automatycznego skalowania

Ustawianie minimalnej liczby wystąpień aplikacji internetowej

Ustawianie maksymalnej liczby wystąpień aplikacji internetowej

Aktualizacja wstępnie uruchomionych wystąpień

Wyłączanie automatycznego skalowania

Często zadawane pytania

Czy automatyczne skalowanie obsługuje aplikacje Azure Functions?

Jak automatyczne skalowanie działa w tle?

Jak są naliczane opłaty za wstępnie uruchomione instancje?

Dlaczego wpisy AppServiceHTTPLogs w dzienniku są podobne do wpisów /admin/host/ping ze statusem 404?

Jak śledzić liczbę wystąpień skalowanych w poziomie podczas automatycznego skalowania zdarzenia?

Jak koligacja ARR wpływa na automatyczne skalowanie?

Dlaczego plan usługi App Service pokazuje więcej przypisanych wystąpień niż zawsze gotowe ustawienia w moich aplikacjach?

Powiązana zawartość

Opinia

Dodatkowe zasoby

Dlaczego wpisy `AppServiceHTTPLogs` w dzienniku są podobne do wpisów `/admin/host/ping` ze statusem 404?