Entwerfen und Ausrichten von Azure ExpressRoute für Resilienz

Azure ExpressRoute ist ein wesentlicher Hybridkonnektivitätsdienst, der häufig für seine niedrige Latenz, Resilienz und private Konnektivität mit hohem Durchsatz zwischen ihrem lokalen Netzwerk und Azure-Workloads verwendet wird. Er bietet die Möglichkeit, Zuverlässigkeit, Resilienz und Notfallwiederherstellung in Netzwerkverbindungen zwischen lokalen Umgebungen und Azure zu erreichen, um die Verfügbarkeit von unternehmenskritischen Workloads sicherzustellen. Diese Funktion erweitert auch den Zugriff auf Azure-Ressourcen auf skalierbare und kostengünstige Weise.

Diagramm, das eine Verbindung zwischen einem lokalen Netzwerk und Azure über ExpressRoute veranschaulicht

Netzwerkverbindungen, die zuverlässig, robust und hochverfügbar sind, sind für ein gut strukturiertes System von entscheidender Bedeutung. Zuverlässigkeit basiert auf zwei Prinzipien: Resilienz und Verfügbarkeit. Das Ziel der Resilienz besteht darin, Fehler zu verhindern und, falls sie auftreten, Ihre Anwendungen in einen voll funktionsfähigen Zustand wiederherzustellen. Das Ziel der Verfügbarkeit besteht darin, einen konsistenten Zugriff auf Ihre Anwendung oder Workload zu ermöglichen. Es ist wichtig, die Zuverlässigkeit basierend auf Ihren geschäftlichen Anforderungen und Anwendungsanforderungen proaktiv zu planen.

Benutzer von ExpressRoute verlassen sich auf die Verfügbarkeit und Leistung von Edgestandorten, WAN und Verfügbarkeitszonen, um ihre Konnektivität mit Azure aufrechtzuerhalten. Bei diesen Komponenten oder Standorten können jedoch aus verschiedenen Gründen Fehler auftreten, z. B. Gerätestörungen, Netzwerkunterbrechungen, Wetterverhältnisse oder Naturkatastrophen. Daher ist die Planung von Zuverlässigkeit, Resilienz und Verfügbarkeit eine gemeinsame Verantwortung von Benutzern und dem Cloudanbieter.

Standortresilienz für ExpressRoute

Es gibt drei ExpressRoute-Resilienzarchitekturen, die verwendet werden können, um Hochverfügbarkeit und Resilienz in Ihren Netzwerkverbindungen zwischen lokalen Umgebungen und Azure sicherzustellen. Zu diesen Architekturentwürfen gehören:

Maximale Resilienz

Die Architektur für maximale Resilienz in ExpressRoute ist dafür strukturiert, einen Single Point of Failure innerhalb des Microsoft-Netzwerkpfads zu vermeiden. Dieses Setup wird durch die Konfiguration eines Verbindungspaars an zwei unterschiedlichen Standorten für die Standortvielfalt mit ExpressRoute erreicht. Das Ziel der maximalen Resilienz ist es, Zuverlässigkeit, Resilienz und Verfügbarkeit zu verbessern, wodurch die höchstmögliche Resilienz für unternehmenskritische Workloads sichergestellt wird. Für solche Vorgänge wird empfohlen, maximale Resilienz zu konfigurieren. Dieser Architekturentwurf wird im Well-Architected Framework unter der Säule „Zuverlässigkeit“ empfohlen. Das ExpressRoute-Entwicklungsteam hat eine geführte Option entwickelt, um Sie bei der Konfiguration der maximalen Resilienz im Portal zu unterstützen.

Diagramm, das ein ExpressRoute-Verbindungspaar veranschaulicht, die an zwei unterschiedlichen Peeringstandorten konfiguriert sind, zwischen einem lokalen Netzwerk und Microsoft

Hohe Resilienz

Hohe Resilienz, auch als Multi-Site-Resilienz oder Standortresilienz bezeichnet, ermöglicht die Verwendung mehrerer Standorte innerhalb desselben Metropolregion, um Ihr lokales Netzwerk über ExpressRoute mit Azure zu verbinden. Hohe Resilienz bietet Standortvielfalt durch Aufteilen einer einzelnen Verbindung auf zwei Standorte. Die erste Verbindung wird an einem Standort und die zweite Verbindung an einem anderen Standort hergestellt. Ziel der Multi-Site-Resilienz ist es, die Auswirkungen der Isolation und Fehler von Edgestandorten zu verringern, indem die Standortvielfalt ermöglicht wird. Die Standortvielfalt wird durch die Verwendung einer einzigen Verbindung über gekoppelte Standorte innerhalb einer Metropolstadt erreicht, wodurch Resilienz für Fehler zwischen Edge und Region entsteht. Hohe Resilienz bietet einen höheren Resilienzgrad als die Standardresilienz, aber nicht so viel wie maximale Resilienz. Hohe Resilienz ist kostentechnisch mit der Standardresilienz identisch, jedoch mit Latenzparität an zwei Standorten. Diese Architektur kann für unternehmenskritische Workloads innerhalb einer Region verwendet werden. Weitere Informationen finden Sie unter ExpressRoute Metro.

Diagramm, das eine einzelne ExpressRoute-Verbindung veranschaulicht, wobei jeder Link an zwei unterschiedlichen Peeringstandorten konfiguriert ist

Standardresilienz

Standardresilienz in ExpressRoute ist eine einzelne Leitung mit zwei Verbindungen, die an einem einzelnen Standort konfiguriert sind. Die integrierte Redundanz (Aktiv/Aktiv) ist so konfiguriert, dass Failover für die beiden Verbindungen der Leitung erleichtert wird. Heute bietet ExpressRoute zwei Verbindungen an einem einzigen Peeringstandort. Wenn ein Fehler an diesem Standort auftritt, kann bei Benutzern ein Konnektivitätsverlust mit ihren Azure-Workloads auftreten. Diese Konfiguration wird auch als einfach vernetzt bezeichnet, da sie Benutzern eine ExpressRoute-Verbindung bietet, die nur mit einem Peeringstandort konfiguriert ist. Diese Konfiguration gilt als die am wenigsten resiliente und wird für unternehmenskritische Workloads nicht empfohlen, da sie keine Standortresilienz bietet.

Diagramm, das eine einzelne ExpressRoute-Verbindung veranschaulicht, wobei jeder Link an einem einzigen Peeringstandort konfiguriert ist

Zonenresilienz für ExpressRoute

Azure-Regionen sind ein wesentlicher Bestandteil Ihrer ExpressRoute-Entwurfs- und -Resilienzstrategie. Diese Regionen sind geografische Standorte von Rechenzentren, die Azure-Dienste hosten. Regionen sind über ein dediziertes Netzwerk mit geringer Latenz vernetzt und so konzipiert, dass sie hochverfügbar, fehlertolerant und skalierbar sind.

Azure bietet mehrere Features, um die regionale Resilienz sicherzustellen. Eines dieser Features sind Verfügbarkeitszonen. Verfügbarkeitszonen schützen Anwendungen und Daten vor Rechenzentrumsfehlern, indem sie sich über mehrere physische Standorte innerhalb einer Region erstrecken. Regionen und Verfügbarkeitszonen sind für Ihre Anwendungsentwurfs- und Resilienzstrategie entscheidend. Mithilfe von Verfügbarkeitszonen können Sie in Ihren Bereitstellungen eine höhere Verfügbarkeit und Resilienz erzielen. Weitere Informationen finden Sie unter Regionen und Verfügbarkeitszonen.

Es wird empfohlen, Ihre ExpressRoute-VNet-Gateways als zonenredundant und verfügbarkeitszonenübergreifend innerhalb einer Region bereitzustellen. Diese Verfügbarkeitszonen sind separate physische Standorte mit unabhängiger Infrastruktur (Energie, Kühlung und Netzwerk). Der Zweck besteht darin, Ihre lokale Netzwerkkonnektivität mit Azure vor Fehlern auf Zonenebene zu schützen. Zonenredundante ExpressRoute-Gateways ermöglichen Resilienz, Skalierbarkeit und höhere Verfügbarkeit für den Zugriff auf unternehmenskritische Dienste in Azure.

Geräteausfälle oder Katastrophen in regionalen und zonenbasierten Rechenzentren können sich auf ExpressRoute-Gatewaybereitstellungen in virtuellen Netzwerken auswirken. Wenn Gateways nicht als zonenredundant bereitgestellt werden, können solche Fehler in einem Azure-Rechenzentrum den Benutzerzugriff auf Azure-Workloads beeinträchtigen.

Wenn Sie über ein nicht zonenredundantes ExpressRoute-Gateway verfügen, können Sie jetzt zu einem verfügbarkeitszonefähigen Gateway migrieren.

Empfehlungen

Im Folgenden finden Sie Empfehlungen, um Hochverfügbarkeit, Resilienz und Zuverlässigkeit in Ihrer ExpressRoute-Netzwerkarchitektur sicherzustellen:

Empfehlungen für ExpressRoute-Verbindungen

Planen für ExpressRoute-Verbindungen oder ExpressRoute Direct

Während der ersten Planungsphase ist es wichtig zu bestimmen, ob eine ExpressRoute-Verbindung oder eine ExpressRoute Direct-Verbindung konfiguriert werden soll. Eine ExpressRoute-Verbindung ermöglicht eine private dedizierte Verbindung mit Azure mit Unterstützung eines Konnektivitätsanbieters. ExpressRoute Direct ermöglicht die Erweiterung eines lokalen Netzwerks direkt in das Microsoft-Netzwerk an einem Peeringstandort. Es ist auch erforderlich, die Bandbreitenanforderung und die SKU-Typanforderung der Verbindung zu ermitteln, um Ihre geschäftlichen Anforderungen zu erfüllen.

Bewerten der Resilienz redundanter ExpressRoute-Verbindungen an mehreren Standorten

Nach der Bereitstellung von redundanten ExpressRoute-Verbindungen mit maximaler Resilienz an mehreren Standorten ist es wichtig, sicherzustellen, dass lokale Routen über die redundanten Verbindungen angekündigt werden, um die Vorteile der Multi-Site-Redundanz optimal zu nutzen. Weitere Informationen zum Bewerten der Resilienz und Testen des Failovers für redundante Verbindungen finden Sie hier.

Planung für die Aktiv/Aktiv-Konfiguration

Um Resilienz und Verfügbarkeit zu verbessern, empfiehlt Microsoft, beide Verbindungen einer ExpressRoute-Leitung in Aktiv/Aktiv-Modus zu betreiben. Indem zwei Verbindungen in diesem Modus ausgeführt werden können, wird der Netzwerkdatenverkehr von Microsoft über die Verbindungen pro Flow verteilt.

Vielfältigkeit auf der Bitübertragungsschicht

Planen Sie für eine bessere Resilienz mehrere Pfade zwischen dem lokalen Edge und den Peeringstandorten (Anbieter-/Microsoft-Edgespeicherorte). Diese Konfiguration kann durch Verwendung verschiedener Dienstanbieter oder durch Routing über einen anderen Peeringstandort über das lokale Netzwerk erzielt werden. Für Hochverfügbarkeit ist es wichtig, die Redundanz der ExpressRoute-Verbindung in der End-to-End-Netzwerkarchitektur aufrechtzuerhalten. Dazu gehört die Aufrechterhaltung von Redundanz innerhalb Ihres lokalen Netzwerks und Redundanz innerhalb Ihres Dienstanbieters. Die Sicherstellung der Redundanz in diesen Teilen Ihrer Architektur bedeutet, dass kein Single Point of Failure vorhanden sein sollte.

Aktivieren und Konfigurieren von bidirektionaler Weiterleitungserkennung

Durch Aktivieren der bidirektionalen Weiterleitungserkennung (Bidirectional Forwarding Detection, BFD) über ExpressRoute kann die Erkennung von Verbindungsfehlern zwischen den MSEE-Geräten und den Routern beschleunigt werden, auf denen Ihre ExpressRoute-Leitung konfiguriert ist. Microsoft empfiehlt, die CPE-Geräte (Customer Premises Edge) mit BFD zu konfigurieren. ExpressRoute kann über Ihre Edgeroutinggeräte oder Ihre Partner Edge-Routinggeräte konfiguriert werden. BFD ist standardmäßig auf den MSEE-Geräten auf Microsoft-Seite aktiviert.

Empfehlungen für ExpressRoute-Gateways

Planung für das VNet-Gateway

Erstellen Sie zonenredundante VNet-Gateways für eine höhere Resilienz, und planen Sie VNet-Gateways in verschiedenen Regionen für die Notfallwiederherstellung und Hochverfügbarkeit. Mit zonenredundanten Gateways können Sie von Zonenresilienz profitieren, um auf Ihre unternehmenskritischen und skalierbaren Dienste in Azure zuzugreifen.

Migrieren zu zonenredundanten ExpressRoute-Gateways

Die geführte Gatewaymigration erleichtert die Migration von einer nicht Az-fähigen SKU zu einem Az-fähigen SKU-Gateway. Dieses Feature ermöglicht die Erstellung eines zusätzlichen VNet-Gateways innerhalb desselben Gatewaysubnetzes. Während des Migrationsprozesses überträgt Azure die Steuerungsebenen- und Datenpfadkonfigurationen von Ihrem vorhandenen Gateway an das neue.

Empfehlungen für Notfallwiederherstellung und Hochverfügbarkeit

Aktivieren von Hochverfügbarkeit und Notfallwiederherstellung

Um die Verfügbarkeit zu maximieren, sollten sowohl die Kunden- als auch die Dienstanbietersegmente in Ihrer ExpressRoute-Verbindung auf Verfügbarkeit und Resilienz ausgerichtet werden. Planen Sie bei der Notfallwiederherstellung für Szenarios wie regionale Dienstausfälle aufgrund von Naturkatastrophen. Implementieren Sie einen resilienten Notfallwiederherstellungsentwurf für mehrere Verbindungen, die über verschiedene Peeringstandorte in verschiedenen Regionen konfiguriert sind. Weitere Informationen finden Sie unter Entwurf für Notfallwiederherstellung.

Planung für Georedundanz

Für die Notfallwiederherstellungsplanung empfehlen wir das Einrichten von ExpressRoute-Verbindungen an mehreren Peeringstandorten und in mehreren Regionen. ExpressRoute-Verbindungen können in derselben Metropolregion oder unterschiedlichen Metropolregionen erstellt werden, und unterschiedliche Dienstanbieter können für verschiedene Pfade durch jede Verbindung verwendet werden. Georedundante ExpressRoute-Verbindungen werden verwendet, um eine resiliente Back-End-Netzwerkkonnektivität für die Notfallwiederherstellung zu schaffen. Weitere Informationen finden Sie unter Entwurf für Hochverfügbarkeit.

Hinweis

Die Verwendung von Site-to-Site-VPN als Sicherungslösung für ExpressRoute-Konnektivität wird nicht empfohlen, wenn Sie latenzempfindliche, unternehmenskritische oder bandbreitenintensive Workloads verwenden. In solchen Fällen ist es ratsam, für die Notfallwiederherstellung mit ExpressRoute Resilienz über mehrere Standorte zu entwerfen, um eine maximale Verfügbarkeit sicherzustellen.

Peering virtueller Netzwerke für die Konnektivität zwischen virtuellen Netzwerken

Das Peering virtueller Netzwerke ist eine effizientere und direktere Methode, durch die Azure-Dienste über virtuelle Netzwerke kommunizieren können, ohne dass ein VNet-Gateway, zusätzliche Hops oder Übertragungen über das öffentliche Internet erforderlich sind. Zum Herstellen von Verbindungen zwischen virtuellen Netzwerken sollte VNet-Peering implementiert werden, um die bestmögliche Leistung zu erzielen. Weitere Informationen finden Sie unter Peering in virtuellen Netzwerken und Erstellen, Ändern oder Löschen eines Peerings virtueller Netzwerke.

Empfehlungen für Überwachung und Warnungen

Konfigurieren der Überwachung und Warnungen für ExpressRoute-Verbindungen

Als Baseline wird empfohlen, Network Insights in Azure Monitor zu konfigurieren, um alle ExpressRoute-Verbindungsmetriken anzuzeigen, einschließlich für ExpressRoute Direct und Global Reach. In der Verbindungskarte können Sie Topologien und Abhängigkeiten für Peerings, Verbindungen und Gateways visualisieren. Zu den verfügbaren Erkenntnissen für Verbindungen gehören Verfügbarkeit, Durchsatz und Paketverluste.

Konfigurieren von Dienststatuswarnungen für ExpressRoute-Verbindungswartungsbenachrichtigungen

ExpressRoute verwendet Azure Service Health, um Sie über geplante und bevorstehende Wartungen von ExpressRoute-Verbindungen zu informieren. Mit Service Health können Sie geplante und vergangene Wartungen im Azure-Portal anzeigen und Warnungen und Benachrichtigungen so konfigurieren, dass sie Ihren Anforderungen am besten entsprechen. In Service Health sehen Sie geplante und vergangene Wartungen. Sie können auch Benachrichtigungen für bevorstehende Wartungen innerhalb von Service Health festlegen.

Konfigurieren des Verbindungsmonitors für ExpressRoute

Der Verbindungsmonitor ist eine cloudbasierte Lösung für die Netzwerküberwachung, die die Konnektivität zwischen Azure-Cloudbereitstellungen und lokalen Standorten (Filialen usw.) überwacht. Der Verbindungsmonitor ist eine agentbasierte Lösung.

Konfigurieren von Systemüberwachung und Warnungen für Gateways

Richten Sie die Überwachung mithilfe von Azure Monitor für die Verfügbarkeit, Leistung und Skalierbarkeit von ExpressRoute Gateways ein. Wenn Sie ein ExpressRoute-Gateway bereitstellen, verwaltet Azure die Computeressourcen und Funktionen Ihres Gateways. Ihnen stehen sechs Gatewaymetriken zur Verfügung, um die Leistung Ihres Gateways nachzuvollziehen.