Usługa Azure Traffic Manager z usługą Azure Site Recovery

Usługa Azure Traffic Manager umożliwia kontrolowanie dystrybucji ruchu między punktami końcowymi aplikacji. Punkt końcowy to dowolna internetowa usługa hostowana wewnątrz platformy Azure lub poza nią.

Usługa Traffic Manager używa systemu nazw domen (DNS) do kierowania żądań klientów do najbardziej odpowiedniego punktu końcowego na podstawie metody routingu ruchu i kondycji punktów końcowych. Usługa Traffic Manager udostępnia szereg metod routingu ruchu oraz opcji monitorowania punktów końcowych, które zaspokoją potrzeby różnych aplikacji i modeli automatycznej pracy w trybie failover. Klienci bezpośrednio łączą się z wybranym punktem końcowym. Usługa Traffic Manager nie jest serwerem proxy ani bramą i nie widzi ruchu przesyłanego między klientem a usługą.

W tym artykule opisano sposób łączenia inteligentnego routingu usługi Azure Traffic Monitor z zaawansowanymi możliwościami odzyskiwania po awarii i migracji w usłudze Azure Site Recovery.

Przechodzenie do trybu failover w środowisku lokalnym na platformie Azure

W pierwszym scenariuszu rozważ firmę A , która ma całą infrastrukturę aplikacji działającą w środowisku lokalnym. Ze względu na ciągłość działania i zgodność firma A decyduje się na korzystanie z usługi Azure Site Recovery w celu ochrony swoich aplikacji.

Firma A uruchamia aplikacje z publicznymi punktami końcowymi i chce bezproblemowo przekierowywać ruch do platformy Azure w przypadku awarii. Metoda priorytetowego routingu ruchu w usłudze Azure Traffic Manager umożliwia firmie A łatwe zaimplementowanie tego wzorca trybu failover.

Konfiguracja jest następująca:

  • Firma A tworzy profil usługi Traffic Manager.
  • Korzystając z metody routingu Priorytet , firma A tworzy dwa punkty końcowe — podstawowy dla środowiska lokalnego i trybu failover dla platformy Azure. Przypisano priorytet podstawowy 1, a tryb failover ma przypisany priorytet 2.
  • Ponieważ podstawowy punkt końcowy jest hostowany poza platformą Azure, punkt końcowy jest tworzony jako zewnętrzny punkt końcowy.
  • W przypadku usługi Azure Site Recovery witryna platformy Azure nie ma żadnych maszyn wirtualnych ani aplikacji uruchomionych przed przejściem w tryb failover. Dlatego punkt końcowy trybu failover jest również tworzony jako zewnętrzny punkt końcowy.
  • Domyślnie ruch użytkowników jest kierowany do aplikacji lokalnej, ponieważ ten punkt końcowy ma skojarzony najwyższy priorytet. Brak ruchu kierowanego do platformy Azure, jeśli podstawowy punkt końcowy jest w dobrej kondycji.

Lokalnie do platformy Azure przed przejściem w tryb failover

W przypadku awarii firma A może wyzwolić przejście w tryb failover na platformę Azure i odzyskać swoje aplikacje na platformie Azure. Gdy usługa Azure Traffic Manager wykryje, że podstawowy punkt końcowy nie jest już w dobrej kondycji, automatycznie używa punktu końcowego trybu failover w odpowiedzi DNS, a użytkownicy łączą się z aplikacją odzyskaną na platformie Azure.

Przechodzenie do środowiska lokalnego na platformę Azure po przejściu w tryb failover

W zależności od wymagań biznesowych firma A może wybrać wyższą lub niższą częstotliwość sondowania , aby przełączać się między środowiskiem lokalnym a platformą Azure w przypadku awarii i zapewnić minimalny przestój dla użytkowników.

Gdy awaria zostanie zawarta, firma A może uruchomić powrót po awarii z platformy Azure do środowiska lokalnego (VMware lub Hyper-V) przy użyciu usługi Azure Site Recovery. Teraz, gdy usługa Traffic Manager wykryje, że podstawowy punkt końcowy jest ponownie w dobrej kondycji, automatycznie korzysta z podstawowego punktu końcowego w odpowiedziach DNS.

Migracja lokalna do platformy Azure

Oprócz odzyskiwania po awarii usługa Azure Site Recovery umożliwia również migracje na platformę Azure. Dzięki zaawansowanym możliwościom testowania pracy w trybie failover w usłudze Azure Site Recovery klienci mogą ocenić wydajność aplikacji na platformie Azure bez wpływu na środowisko lokalne. Gdy klienci są gotowi do migracji, mogą zdecydować się na migrację całych obciążeń razem lub zdecydować się na stopniowe migrowanie i skalowanie.

Metoda routingu ważonego usługi Azure Traffic Manager może służyć do kierowania części ruchu przychodzącego na platformę Azure przy jednoczesnym kierowaniu większości do środowiska lokalnego. Takie podejście może pomóc ocenić wydajność skalowania, ponieważ możesz nadal zwiększać wagę przypisaną do platformy Azure w miarę migrowania większej liczby obciążeń na platformę Azure.

Na przykład firma B wybiera migrację w fazach, przenosząc część swojego środowiska aplikacji przy zachowaniu pozostałej części środowiska lokalnego. W początkowych etapach, gdy większość środowiska jest lokalna, większa waga jest przypisywana do środowiska lokalnego. Usługa Traffic Manager zwraca punkt końcowy na podstawie wag przypisanych do dostępnych punktów końcowych.

Migracja lokalna do platformy Azure

Podczas migracji oba punkty końcowe są aktywne, a większość ruchu jest kierowana do środowiska lokalnego. Podczas migracji można przypisać większą wagę do punktu końcowego na platformie Azure, a na koniec lokalny punkt końcowy można dezaktywować po migracji.

Tryb failover platformy Azure do platformy Azure

W tym przykładzie rozważmy firmę C , która ma całą infrastrukturę aplikacji działającą na platformie Azure. Ze względu na ciągłość działalności biznesowej i zgodność firma C decyduje się na korzystanie z usługi Azure Site Recovery w celu ochrony swoich aplikacji.

Firma C uruchamia aplikacje z publicznymi punktami końcowymi i chce bezproblemowo przekierowywać ruch do innego regionu świadczenia usługi Azure w przypadku awarii. Metoda priorytetowego routingu ruchu umożliwia firmie C łatwe zaimplementowanie tego wzorca trybu failover.

Konfiguracja jest następująca:

  • Firma C tworzy profil usługi Traffic Manager.
  • Korzystając z metody routingu Priorytet , firma C tworzy dwa punkty końcowe — podstawowy dla regionu źródłowego (Azja Wschodnia Azure) i tryb failover dla regionu odzyskiwania (Azja Południowo-Wschodnia Azure). Przypisano priorytet podstawowy 1, a tryb failover ma przypisany priorytet 2.
  • Ponieważ podstawowy punkt końcowy jest hostowany na platformie Azure, punkt końcowy może być punktem końcowym platformy Azure .
  • W przypadku usługi Azure Site Recovery lokacja platformy Azure odzyskiwania nie ma żadnych maszyn wirtualnych ani aplikacji uruchomionych przed przejściem w tryb failover. W związku z tym punkt końcowy trybu failover można utworzyć jako zewnętrzny punkt końcowy.
  • Domyślnie ruch użytkownika jest kierowany do aplikacji regionu źródłowego (Azja Wschodnia), ponieważ ten punkt końcowy ma skojarzony najwyższy priorytet. Jeśli podstawowy punkt końcowy jest w dobrej kondycji, żaden ruch nie jest kierowany do regionu odzyskiwania.

Azure-to-Azure przed przejściem do trybu failover

W przypadku awarii firma C może wyzwolić tryb failover i odzyskać swoje aplikacje w regionie odzyskiwania platformy Azure. Gdy usługa Azure Traffic Manager wykryje, że podstawowy punkt końcowy nie jest już w dobrej kondycji, automatycznie używa punktu końcowego trybu failover w odpowiedzi DNS, a użytkownicy łączą się z aplikacją odzyskaną w regionie odzyskiwania platformy Azure (Azja Południowo-Wschodnia).

Azure-to-Azure po przejściu w tryb failover

W zależności od wymagań biznesowych firma C może wybrać wyższą lub niższą częstotliwość sondowania , aby przełączać się między regionami źródła i odzyskiwania oraz zapewnić minimalny przestój dla użytkowników.

Po wystąpieniu awarii firma C może uruchomić powrót po awarii z regionu odzyskiwania platformy Azure do źródłowego regionu świadczenia usługi Azure przy użyciu usługi Azure Site Recovery. Teraz, gdy usługa Traffic Manager wykryje, że podstawowy punkt końcowy jest ponownie w dobrej kondycji, automatycznie korzysta z podstawowego punktu końcowego w odpowiedziach DNS.

Ochrona aplikacji dla przedsiębiorstw w wielu regionach

Globalne przedsiębiorstwa często ulepszają środowisko klienta, dostosowując swoje aplikacje do potrzeb regionalnych. Zmniejszenie lokalizacji i opóźnień może prowadzić do podziału infrastruktury aplikacji między regionami. Przedsiębiorstwa są również powiązane z regionalnymi przepisami dotyczącymi danych w niektórych obszarach i decydują się odizolować część infrastruktury aplikacji w granicach regionalnych.

Rozważmy przykład, w którym firma D podzieliła swoje punkty końcowe aplikacji, aby oddzielnie obsługiwać Niemcy i resztę świata. Firma D używa metody routingu geograficznego usługi Azure Traffic Manager do skonfigurowania tej metody. Każdy ruch pochodzący z Niemiec jest kierowany do punktu końcowego 1 , a każdy ruch pochodzący z Niemiec jest kierowany do punktu końcowego 2.

Problem z tą konfiguracją polega na tym, że jeśli punkt końcowy 1 przestanie działać z jakiegokolwiek powodu, nie ma przekierowania ruchu do punktu końcowego 2. Ruch pochodzący z Niemiec nadal jest kierowany do punktu końcowego 1 niezależnie od kondycji punktu końcowego, pozostawiając niemieckich użytkowników bez dostępu do aplikacji firmy D. Podobnie, jeśli punkt końcowy 2 przechodzi w tryb offline, nie ma przekierowania ruchu do punktu końcowego 1.

Aplikacja z wieloma regionami przed

Aby uniknąć wystąpienia tego problemu i zapewnić odporność aplikacji, firma D używa zagnieżdżonych profilów usługi Traffic Manager z usługą Azure Site Recovery. W konfiguracji profilu zagnieżdżonego ruch nie jest kierowany do poszczególnych punktów końcowych, ale do innych profilów usługi Traffic Manager. Oto jak działa ta konfiguracja:

  • Zamiast używać routingu geograficznego z poszczególnymi punktami końcowymi firma D używa routingu geograficznego z profilami usługi Traffic Manager.
  • Każdy podrzędny profil usługi Traffic Manager korzysta z routingu priorytetowego z podstawowym i punktem końcowym odzyskiwania, dlatego zagnieżdża routing priorytetu w ramach routingu geograficznego .
  • Aby umożliwić odporność aplikacji, każda dystrybucja obciążeń korzysta z usługi Azure Site Recovery do przejścia w tryb failover do regionu odzyskiwania opartego na przypadku wystąpienia awarii.
  • Gdy nadrzędna usługa Traffic Manager odbiera zapytanie DNS, jest kierowana do odpowiedniego podrzędnego usługi Traffic Manager, który odpowiada na zapytanie z dostępnym punktem końcowym.

Aplikacja z wieloma regionami po

Jeśli na przykład punkt końcowy w Niemczech Środkowy ulegnie awarii, można szybko odzyskać aplikację na północny wschód od Niemiec. Nowy punkt końcowy obsługuje ruch pochodzący z Niemiec z minimalnym przestojem dla użytkowników. Podobnie awaria punktu końcowego w regionie Europa Zachodnia może być obsługiwana przez odzyskanie obciążenia aplikacji do Europy Północnej, a usługa Azure Traffic Manager obsługuje przekierowania DNS do dostępnego punktu końcowego.

Powyższe ustawienia można rozszerzyć, aby uwzględnić dowolną wymaganą kombinację regionów i punktów końcowych. Usługa Traffic Manager umożliwia maksymalnie 10 poziomów zagnieżdżonych profilów i nie zezwala na pętle w konfiguracji zagnieżdżonej.

Zagadnienia dotyczące celu czasu odzyskiwania (RTO)

W większości organizacji dodawanie lub modyfikowanie rekordów DNS jest obsługiwane przez oddzielny zespół lub przez kogoś spoza organizacji. To sprawia, że zadanie zmiany rekordów DNS jest bardzo trudne. Czas potrzebny na zaktualizowanie rekordów DNS przez inne zespoły lub organizacje zarządzające infrastrukturą DNS różni się od organizacji i wpływa na cel czasu odzyskiwania aplikacji.

Korzystając z usługi Traffic Manager, można najpierw załadować pracę wymaganą dla aktualizacji DNS. W momencie rzeczywistego przejścia w tryb failover nie jest wymagana żadna akcja ręczna ani skryptowa. Takie podejście pomaga w szybkim przełączaniu (a tym samym obniżaniu celu czasu odzyskiwania), a także unikaniu kosztownych czasochłonnych błędów zmian DNS w przypadku awarii. W przypadku usługi Traffic Manager nawet krok powrotu po awarii jest zautomatyzowany, co w przeciwnym razie musi być zarządzane oddzielnie.

Ustawienie poprawnego interwału sondowania za pomocą podstawowych lub szybkich testów kondycji interwału może znacznie obniżyć cel czasu odzyskiwania podczas pracy w trybie failover i zmniejszyć czas przestoju dla użytkowników.

Możesz dodatkowo zoptymalizować wartość czasu dns na żywo (TTL) dla profilu usługi Traffic Manager. Czas wygaśnięcia to wartość, dla której wpis DNS będzie buforowany przez klienta. W przypadku rekordu usługa DNS nie będzie dwukrotnie odpytywała w zakresie czasu wygaśnięcia. Każdy rekord DNS ma skojarzony czas wygaśnięcia. Zmniejszenie tej wartości powoduje zwiększenie liczby zapytań DNS do usługi Traffic Manager, ale może zmniejszyć cel czasu odzyskiwania przez szybsze odnajdywanie awarii.

Czas wygaśnięcia napotkany przez klienta również nie zwiększa się, jeśli liczba rozpoznawania nazw DNS między klientem a autorytatywnym serwerem DNS zwiększa się. Rozpoznawanie nazw DNS "odlicza" czas wygaśnięcia i przekazuje tylko wartość czasu wygaśnięcia, która odzwierciedla czas, który upłynął od czasu buforowania rekordu. Dzięki temu rekord DNS zostanie odświeżony na kliencie po upływie czasu wygaśnięcia, niezależnie od liczby rozpoznawania nazw DNS w łańcuchu.

Następne kroki