Skalowanie usługi Application Gateway w wersji 2 i zapory aplikacji internetowej w wersji 2
Usługę Application Gateway i zaporę aplikacji internetowej można skonfigurować do skalowania w dwóch trybach:
- Skalowanie automatyczne — przy włączonym skalowaniu automatycznym jednostki SKU usługi Application Gateway i zapory aplikacji internetowej w wersji 2 są skalowane w poziomie lub w oparciu o wymagania dotyczące ruchu aplikacji. Ten tryb zapewnia lepszą elastyczność aplikacji i eliminuje konieczność odgadnięcia rozmiaru bramy aplikacji lub liczby wystąpień. Ten tryb pozwala również zaoszczędzić koszty, nie wymagając, aby brama została uruchomiona w maksymalnej pojemności aprowizowanej dla oczekiwanego maksymalnego obciążenia ruchu. Musisz określić minimalną i opcjonalnie maksymalną liczbę wystąpień. Minimalna pojemność gwarantuje, że usługa Application Gateway i zapora aplikacji internetowej w wersji 2 nie spadną poniżej określonej minimalnej liczby wystąpień, nawet bez ruchu. Każde wystąpienie jest mniej więcej równoważne 10 jednostki pojemności zarezerwowanej. Zero oznacza brak pojemności zarezerwowanej i jest czysto autoskalowanie w naturze. Opcjonalnie można również określić maksymalną liczbę wystąpień, co gwarantuje, że usługa Application Gateway nie będzie skalować poza określoną liczbę wystąpień. Opłaty są naliczane tylko za ilość ruchu obsługiwanego przez bramę. Liczba wystąpień może wahać się od 0 do 125. Wartość domyślna maksymalnej liczby wystąpień to 10, jeśli nie zostanie określona.
Uwaga
Jeśli maksymalna liczba wystąpień zostanie zaktualizowana do wartości mniejszej niż bieżąca liczba wystąpień, nowe ustawienie nie zacznie obowiązywać natychmiast. Nowo zaktualizowana wartość maksymalna będzie wymuszana tylko po operacji skalowania, która spowoduje przeniesienie bieżącej liczby poniżej nowo zaktualizowanej maksymalnej liczby. Jeśli operacja skalowania w poziomie nie zostanie wykonana, ponieważ skalowanie automatyczne w progach nie zostanie spełnione, nowe ustawienie maksymalne nie zostanie zastosowane.
- Ręczne — możesz również wybrać tryb ręczny, w którym brama nie skaluje się automatycznie. W tym trybie, jeśli istnieje większy ruch niż usługa Application Gateway lub zapora aplikacji internetowej, może to spowodować utratę ruchu. W trybie ręcznym określanie liczby wystąpień jest obowiązkowe. Liczba wystąpień może się różnić od 1 do 125 wystąpień.
Uwaga
Te tryby skalowania nie mają zastosowania do usługi Application Gateway w warstwie Podstawowa. Usługa Application Gateway Basic automatycznie skaluje w górę do około 200 połączeń na sekundę na podstawie certyfikatu TLS klucza RSA 2048-bitowego.
Skalowanie automatyczne i wysoka dostępność
aplikacja systemu Azure Bramy są zawsze wdrażane w sposób o wysokiej dostępności. Usługa składa się z wielu wystąpień, które są tworzone zgodnie z konfiguracją, jeśli skalowanie automatyczne jest wyłączone lub wymagane przez ładowanie aplikacji, jeśli skalowanie automatyczne jest włączone. Z perspektywy użytkownika nie musisz mieć wglądu w poszczególne wystąpienia, ale tylko do usługi Application Gateway jako całości. Jeśli określone wystąpienie ma problem i przestanie działać, aplikacja systemu Azure Gateway w sposób niewidoczny tworzy nowe wystąpienie.
Nawet jeśli skonfigurujesz skalowanie automatyczne z zerowymi wystąpieniami minimalnymi, usługa jest nadal wysoce dostępna, która jest zawsze uwzględniana w stałej cenie.
Należy jednak pamiętać, że aprowizowanie nowego wystąpienia może potrwać od około sześciu do siedmiu minut. Zrozumienie zachowania skalowania wystąpień usługi Application Gateway jest kluczem do utrzymania wydajności w różnych obciążeniach. Te wystąpienia są skalowane w poziomie w grupach, a rozmiar grupy jest aktywnie zwiększany, gdy bieżąca liczba wystąpień jest wyższa. Ta strategia pozwala systemowi wydajnie zarządzać wzrostami obciążeń, zapobiegając potencjalnym przerwom w działaniu usługi lub spowolnieniu. Każde wystąpienie bramy aplikacja systemu Azure może obsłużyć maksymalnie 10 jednostek pojemności. Aby zoptymalizować ustawienia skalowania automatycznego, rozważ typowe wzorce ruchu i odpowiednio ustaw minimalne wystąpienia w celu zapewnienia bezproblemowej operacji.
W przypadku zdarzeń skalowanych w poziomie usługa Application Gateway opróżnia istniejące połączenia przez 5 minut w wystąpieniu, którego dotyczy usunięcie. Po upływie 5 minut istniejące połączenia zostaną zamknięte i wystąpienie zostanie usunięte. Wszelkie nowe połączenia w czasie lub po upływie 5-minutowego skalowania są ustanawiane do innych istniejących wystąpień w tej samej bramie.