Projektowanie pod kątem odzyskiwania po awarii za pomocą prywatnej komunikacji równorzędnej usługi ExpressRoute

Usługa ExpressRoute została zaprojektowana pod kątem wysokiej dostępności, aby zapewnić prywatną łączność sieciową klasy operatora z zasobami firmy Microsoft. Innymi słowy, w ścieżce usługi ExpressRoute w sieci firmy Microsoft nie ma jednego punktu awarii. Aby zapoznać się z zagadnieniami dotyczącymi projektowania w celu zmaksymalizowania dostępności obwodu usługi ExpressRoute, zobacz Projektowanie pod kątem wysokiej dostępności za pomocą usługi ExpressRoute i dobrze zaprojektowanej platformy

Jednak biorąc pod uwagę popularną reklamę Murphy'ego — jeśli coś może pójść nie tak, należy wziąć pod uwagę, w tym artykule skupimy się na rozwiązaniach wykraczających poza awarie, które można rozwiązać przy użyciu jednego obwodu usługi ExpressRoute. Przyjrzymy się zagadnieniom dotyczącym architektury sieci w celu utworzenia niezawodnej łączności sieciowej zaplecza na potrzeby odzyskiwania po awarii przy użyciu geograficznie nadmiarowych obwodów usługi ExpressRoute.

Uwaga

Pojęcia opisane w tym artykule mają zastosowanie również w przypadku utworzenia obwodu usługi ExpressRoute w usłudze Virtual WAN lub poza nim.

Potrzeba nadmiarowego rozwiązania do łączności

Istnieją możliwości i wystąpienia, w których lokalizacja komunikacji równorzędnej usługi ExpressRoute lub cała usługa regionalna ulega pogorszeniu. Główną przyczyną takiej regionalnej awarii szerokiej usługi są naturalne katastrofy. W związku z tym ważne jest zaplanowanie odzyskiwania po awarii dla ciągłości działania i aplikacji o znaczeniu krytycznym.

Uwaga

Jeśli musisz zaimplementować projekt odzyskiwania po awarii w sytuacji wrażliwej na czas, na przykład w celu zachowania ciągłości działania podczas klęski żywiołowej, należy wziąć pod uwagę następujące czynniki:

  • Ten dokument zawiera wskazówki dotyczące implementowania niezawodnego projektu odzyskiwania po awarii dla wielu obwodów usługi ExpressRoute skonfigurowanych za pośrednictwem różnych lokalizacji komunikacji równorzędnej. W tym scenariuszu przyjęto założenie, że masz wystarczający czas i zasoby do skonfigurowania obwodów usługi ExpressRoute.
  • Jeśli musisz szybko skonfigurować projekt odzyskiwania po awarii dla pojedynczego obwodu usługi ExpressRoute, który nie jest geograficznie nadmiarowy, możesz użyć następujących alternatyw:

Bez względu na to, czy uruchamiasz aplikacje o znaczeniu krytycznym w regionie świadczenia usługi Azure, czy lokalnie, czy w dowolnym innym miejscu, możesz użyć innego regionu platformy Azure jako witryny trybu failover. Następujące artykuły dotyczą odzyskiwania po awarii z aplikacji i perspektyw dostępu frontonu:

Jeśli korzystasz z łączności usługi ExpressRoute między siecią lokalną a firmą Microsoft, należy rozważyć następujące kwestie, aby zaplanować odzyskiwanie po awarii za pośrednictwem usługi ExpressRoute:

Wyzwania związane z używaniem wielu obwodów usługi ExpressRoute

Gdy łączysz ten sam zestaw sieci przy użyciu więcej niż jednego połączenia, wprowadzasz równoległe ścieżki między sieciami. Ścieżki równoległe, jeśli nie są prawidłowo zaprojektowane, mogą prowadzić do routingu asymetrycznego. Jeśli masz jednostki stanowe, na przykład translator adresów sieciowych lub zaporę w ścieżce, routing asymetryczny może blokować przepływ ruchu. Zazwyczaj za pośrednictwem prywatnej ścieżki komunikacji równorzędnej usługi ExpressRoute nie występują jednostki stanowe, takie jak translator adresów sieciowych lub zapory. W związku z tym routing asymetryczny za pośrednictwem prywatnej komunikacji równorzędnej usługi ExpressRoute nie musi blokować przepływu ruchu.

Jeśli jednak równoważysz obciążenie ruchem między geograficznie nadmiarowymi ścieżkami równoległymi, niezależnie od tego, czy masz jednostki stanowe, czy nie, wystąpi niespójna wydajność sieci. Te geograficznie nadmiarowe ścieżki równoległe mogą być za pośrednictwem tego samego metra lub innego metra znajdującego się na stronie lokalizacji dostawcy.

Nadmiarowość z obwodami usługi ExpressRoute w tym samym metrze

Wiele metra ma dwie lokalizacje usługi ExpressRoute. Przykładem może być Amsterdam i Amsterdam2. Podczas projektowania nadmiarowości można utworzyć dwie równoległe ścieżki do platformy Azure z obiema lokalizacjami w tym samym metrze. To zadanie można wykonać z tym samym dostawcą lub wybrać pracę z innym dostawcą usług, aby zwiększyć odporność. Kolejną zaletą tego projektu jest to, że w przypadku przejścia aplikacji w tryb failover opóźnienie między aplikacjami lokalnymi a firmą Microsoft pozostaje w przybliżeniu takie samo. Jeśli jednak wystąpi klęska żywiołowa, taka jak trzęsienie ziemi, łączność obu ścieżek może nie być już dostępna.

Nadmiarowość z obwodami usługi ExpressRoute w różnych metrach

W przypadku korzystania z różnych metra na potrzeby nadmiarowości należy wybrać lokalizację pomocniczą w tym samym regionie geopolitycznym. Aby wybrać lokalizację poza regionem geograficznym, należy użyć jednostki SKU Premium dla obu obwodów w ścieżkach równoległych. Zaletą tej konfiguracji jest prawdopodobieństwo wystąpienia klęski żywiołowej powodującej awarię obu łączy jest niższe, ale kosztem zwiększonego opóźnienia.

Uwaga

Włączenie systemu BFD w obwodach usługi ExpressRoute pomoże w szybszym wykrywaniu błędów połączenia między urządzeniami microsoft Enterprise Edge (MSEE) i routerami brzegowymi klienta/partnera. Jednak ogólny tryb failover i zbieżność lokacji nadmiarowej może potrwać do 180 sekund w niektórych warunkach awarii i może wystąpić zwiększone opóźnienie lub obniżenie wydajności w tym czasie.

W tym artykule omówiono sposób rozwiązywania problemów, z którymi można się zmierzyć podczas konfigurowania ścieżek geograficznie nadmiarowych.

Zagadnienia dotyczące małych i średnich sieci lokalnych

Rozważmy przykładowa sieć zilustrowana na poniższym diagramie. W tym przykładzie łączność geograficznie nadmiarowa usługi ExpressRoute jest ustanawiana między lokalizacją lokalną firmy Contoso a siecią wirtualną firmy Contoso w regionie świadczenia usługi Azure. Na diagramie niebieska linia wskazuje preferowaną ścieżkę (za pośrednictwem usługi ExpressRoute 1), a kropkowana reprezentuje ścieżkę autonomiczną (za pośrednictwem usługi ExpressRoute 2).

Diagram of small to medium size on-premises network considerations.

Jeśli domyślnie anonsujesz trasy identycznie na wszystkich ścieżkach usługi ExpressRoute, obciążenie platformy Azure równoważy ruch lokalny we wszystkich ścieżkach usługi ExpressRoute przy użyciu routingu z wieloma ścieżkami równymi kosztami (ECMP).

Jednak w przypadku obwodów geograficznie nadmiarowych usługi ExpressRoute należy wziąć pod uwagę różne wydajności sieci z różnymi ścieżkami sieciowymi (szczególnie w przypadku opóźnienia sieci). Aby uzyskać bardziej spójną wydajność sieci podczas normalnego działania, warto wybrać obwód usługi ExpressRoute, który oferuje minimalne opóźnienie.

Możesz mieć wpływ na platformę Azure, aby preferować jeden obwód usługi ExpressRoute nad innym przy użyciu jednej z następujących technik (wymienionych w kolejności skuteczności):

  • anonsowanie bardziej szczegółowej trasy w preferowanym obwodzie usługi ExpressRoute w porównaniu z innymi obwodami usługi ExpressRoute
  • Konfigurowanie wyższej wagi Połączenie ion w połączeniu, które łączy sieć wirtualną z preferowanym obwodem usługi ExpressRoute
  • anonsowanie tras w mniej preferowanym obwodzie usługi ExpressRoute z dłuższą ścieżką AS (ścieżka AS prepend)

Bardziej szczegółowa trasa

Na poniższym diagramie przedstawiono wpływ na wybór ścieżki usługi ExpressRoute przy użyciu bardziej szczegółowego anonsu trasy. W przedstawionym przykładzie lokalny /24 zakres adresów IP firmy Contoso jest anonsowany jako dwa /25 zakresów adresów za pośrednictwem preferowanej ścieżki (ExpressRoute 1) i jako /24 za pośrednictwem ścieżki autonomicznej (ExpressRoute 2).

Diagram of influencing path selection using more specific routes.

Ponieważ /25 jest bardziej szczegółowe, w porównaniu do /24, platforma Azure wyśle ruch kierowany do 10.1.11.0/24 za pośrednictwem usługi ExpressRoute 1 w normalnym stanie. Jeśli obie połączenia usługi ExpressRoute 1 spadną, sieć wirtualna zobaczy anons trasy 10.1.11.0/24 tylko za pośrednictwem usługi ExpressRoute 2; w związku z tym obwód rezerwowy jest używany w tym stanie awarii.

waga Połączenie ionów

Poniższy zrzut ekranu przedstawia konfigurowanie wagi połączenia usługi ExpressRoute za pośrednictwem witryny Azure Portal.

Screenshot of configuring connection weight via Azure portal.

Na poniższym diagramie przedstawiono wpływ na wybór ścieżki usługi ExpressRoute przy użyciu wagi połączenia. Domyślna waga połączenia to 0. W poniższym przykładzie waga połączenia dla usługi ExpressRoute 1 jest skonfigurowana jako 100. Gdy sieć wirtualna odbiera prefiks trasy anonsowany za pośrednictwem więcej niż jednego obwodu usługi ExpressRoute, sieć wirtualna preferuje połączenie z najwyższą wagą.

Diagram of influencing path selection using connection weight.

Jeśli obie połączenia usługi ExpressRoute 1 spadną, sieć wirtualna zobaczy anons trasy 10.1.11.0/24 tylko za pośrednictwem usługi ExpressRoute 2; w związku z tym obwód rezerwowy jest używany w tym stanie awarii.

Ścieżka AS jest poprzedzana

Na poniższym diagramie przedstawiono wpływ na wybór ścieżki usługi ExpressRoute przy użyciu prepend ścieżki AS. Na diagramie anons trasy za pośrednictwem usługi ExpressRoute 1 wskazuje domyślne zachowanie protokołu eBGP. W anonsie trasy za pośrednictwem usługi ExpressRoute 2 numer ASN sieci lokalnej jest dodatkowo dołączany do ścieżki AS trasy. Gdy ta sama trasa jest odbierana za pośrednictwem wielu obwodów usługi ExpressRoute, zgodnie z procesem wyboru trasy eBGP sieć wirtualna preferuje trasę z najkrótszą ścieżką AS.

Diagram of influencing path selection using AS path prepend.

Jeśli obie połączenia usługi ExpressRoute 1 spadną, sieć wirtualna zobaczy anons trasy 10.1.11.0/24 tylko za pośrednictwem usługi ExpressRoute 2. W związku z tym dłuższa ścieżka AS stałaby się nieistotna. W związku z tym obwód rezerwowy będzie używany w tym stanie awarii.

Korzystając z dowolnej z technik, jeśli masz wpływ na platformę Azure, aby preferować jedną z usług ExpressRoute przez inne, musisz również upewnić się, że sieć lokalna preferuje również tę samą ścieżkę usługi ExpressRoute dla ruchu powiązanego z platformą Azure, aby uniknąć przepływów asymetrycznych. Zazwyczaj wartość preferencji lokalnej jest używana do wpływania na sieć lokalną, aby preferować jeden obwód usługi ExpressRoute przez inne. Preferencja lokalna to wewnętrzna metryka protokołu BGP (iBGP). Preferowana jest trasa protokołu BGP o najwyższej wartości preferencji lokalnej.

Ważne

W przypadku korzystania z niektórych obwodów usługi ExpressRoute jako rezerwowych należy aktywnie zarządzać nimi i okresowo testować operację pracy w trybie failover.

Duża rozproszona sieć przedsiębiorstwa

Jeśli masz dużą rozproszoną sieć przedsiębiorstwa, prawdopodobnie masz wiele obwodów usługi ExpressRoute. W tej sekcji zobaczymy, jak zaprojektować odzyskiwanie po awarii przy użyciu aktywnych obwodów usługi ExpressRoute bez konieczności używania innych obwodów rezerwowych.

Rozważmy przykład przedstawiony na poniższym diagramie. W tym przykładzie firma Contoso ma dwie lokalizacje lokalne połączone z dwoma wdrożeniami IaaS firmy Contoso w dwóch różnych regionach świadczenia usługi Azure za pośrednictwem obwodów usługi ExpressRoute w dwóch różnych lokalizacjach komunikacji równorzędnej.

Diagram of large distributed on-premises network considerations.

Sposób tworzenia architektury odzyskiwania po awarii ma wpływ na sposób kierowania ruchu między regionami (region1/region2 do lokalizacji2/lokalizacji1). Rozważmy dwie różne architektury awarii, które inaczej kieruje ruch między regionami.

Scenariusz 1

W pierwszym scenariuszu zaprojektujmy odzyskiwanie po awarii, tak aby cały ruch między regionem świadczenia usługi Azure i siecią lokalną przepływał przez lokalny obwód usługi ExpressRoute w stanie stałym. Jeśli lokalny obwód usługi ExpressRoute ulegnie awarii, zdalny obwód usługi ExpressRoute jest używany dla wszystkich przepływów ruchu między platformą Azure i siecią lokalną.

Scenariusz 1 przedstawiono na poniższym diagramie. Na diagramie zielone linie wskazują ścieżki przepływu ruchu między sieciami VNet1 i lokalnymi. Niebieskie linie wskazują ścieżki przepływu ruchu między sieciami VNet2 i lokalnymi. Linie stałe wskazują żądaną ścieżkę w stanie stałym, a linie przerywane wskazują ścieżkę ruchu w awarii odpowiedniego obwodu usługi ExpressRoute, który prowadzi przepływ ruchu w stanie stałym.

Diagram of traffic flow for first scenario.

Scenariusz można zaprojektować przy użyciu wagi połączenia, aby wpłynąć na sieci wirtualne, aby preferować połączenie z lokalną lokalizacją komunikacji równorzędnej ExpressRoute dla ruchu powiązanego z siecią lokalną. Aby ukończyć rozwiązanie, należy zapewnić symetryczny przepływ ruchu zwrotnego. Możesz użyć preferencji lokalnych w sesji iBGP między routerami BGP (na których obwody usługi ExpressRoute są przerywane po stronie lokalnej), aby preferować obwód usługi ExpressRoute. Rozwiązanie zostało zilustrowane na poniższym diagramie.

Diagram of active-active ExpressRoute circuits solution 1.

Scenariusz 2

Scenariusz 2 przedstawiono na poniższym diagramie. Na diagramie zielone linie wskazują ścieżki przepływu ruchu między sieciami VNet1 i lokalnymi. Niebieskie linie wskazują ścieżki przepływu ruchu między sieciami VNet2 i lokalnymi. Na diagramie stałe linie stałe, cały ruch między sieciami wirtualnymi i lokalizacjami lokalnymi przepływa normalnie przy użyciu sieci szkieletowej firmy Microsoft i przepływa przez połączenia między lokalizacjami lokalnymi tylko w stanie awarii, kropkowane linie na diagramie usługi ExpressRoute.

Diagram of traffic flow for second scenario.

Rozwiązanie zostało zilustrowane na poniższym diagramie. Jak pokazano, możesz zaprojektować scenariusz przy użyciu bardziej szczegółowej trasy (opcja 1) lub prepend ścieżki AS (opcja 2), aby wpłynąć na wybór ścieżki sieci wirtualnej. Aby wpłynąć na wybór tras sieci lokalnych dla ruchu powiązanego z platformą Azure, należy skonfigurować wzajemne połączenia między lokalizacją lokalną jako mniej preferowaną. Sposób konfigurowania połączenia wzajemnego w preferowany sposób zależy od protokołu routingu używanego w sieci lokalnej. Możesz użyć preferencji lokalnych z iBGP lub metryki z IGP (OSPF lub IS-IS).

Diagram of active-active ExpressRoute circuits solution 2.

Ważne

Gdy jeden lub wiele obwodów usługi ExpressRoute jest połączonych z wieloma sieciami wirtualnymi, sieć wirtualna z ruchem sieci wirtualnej może kierować za pośrednictwem usługi ExpressRoute. Nie jest to jednak zalecane. Aby włączyć łączność sieci wirtualnej z siecią wirtualną, skonfiguruj komunikację równorzędną sieci wirtualnych.

Następne kroki

W tym artykule omówiono sposób projektowania odzyskiwania po awarii łączności prywatnej komunikacji równorzędnej obwodu usługi ExpressRoute. Następujące artykuły dotyczą odzyskiwania po awarii z aplikacji i perspektyw dostępu frontonu: