ExpressRoute 프라이빗 피어링을 사용한 재해 복구를 위한 디자인

ExpressRoute는 Microsoft 리소스에 대한 이동 통신 사업자급 프라이빗 네트워크 연결을 제공하는 고가용성을 위해 설계되었습니다. 즉, Microsoft 네트워크의 ExpressRoute 경로에는 단일 실패 지점이 없습니다. ExpressRoute 회로의 가용성을 최대화하기 위한 디자인 고려 사항은 ExpressRoute를 사용한 고가용성을 위한 디자인Well-Architectured Framework를 참조하세요.

그러나 Murphy의 인기 있는 격언(잘못될 일은 잘못된다)을 고려하여, 이 문서에서는 단일 ExpressRoute 회로를 사용하여 해결할 수 있는 실패를 넘어서는 솔루션에 초점을 맞춰 보겠습니다. 지역 중복 ExpressRoute 회로를 사용하여 재해 복구를 위한 강력한 백 엔드 네트워크 연결을 구축하기 위한 네트워크 아키텍처 고려 사항을 살펴봅니다.

참고 항목

이 문서에 설명된 개념은 Virtual WAN 또는 Virtual WAN 외부에서 ExpressRoute 회로를 만들 때 동일하게 적용됩니다.

중복 연결 솔루션 필요

ExpressRoute 피어링 위치 또는 전체 지역 서비스의 성능이 저하될 가능성과 인스턴스가 있습니다. 지역 전체에 서비스가 중단되는 근본 원인으로는 자연재해가 있습니다. 따라서 비즈니스 연속성 및 중요 업무용 애플리케이션의 경우 재해 복구를 계획하는 것이 중요합니다.

참고 항목

시간에 민감한 상황(예: 자연 재해 시 비즈니스 연속성 유지)에서 재해 복구 디자인을 구현해야 하는 경우 다음 요소를 고려해야 합니다.

  • 이 문서에서는 서로 다른 피어링 위치를 통해 구성된 여러 ExpressRoute 회로에 대한 강력한 재해 복구 디자인을 구현하는 방법에 대한 지침을 제공합니다. 이 시나리오에서는 ExpressRoute 회로를 설정하는 데 충분한 시간과 리소스가 있다고 가정합니다.
  • 지역 중복이 아닌 단일 ExpressRoute 회로에 대한 재해 복구 디자인을 신속하게 구성해야 하는 경우 다음 대안을 사용할 수 있습니다.
    • 개인 피어링 트래픽에 대한 백업으로 사이트 간 VPN을 사용합니다.
    • 인터넷 연결을 Microsoft 피어링 트래픽에 대한 백업으로 사용합니다.

Azure 지역, 온-프레미스 또는 다른 곳에서 중요 업무용 애플리케이션을 실행하는지 여부와 관계없이 다른 Azure 지역을 장애 조치(failover) 사이트로 사용할 수 있습니다. 다음 문서에서는 애플리케이션과 프런트 엔드 액세스 관점에서 재해 복구를 다룹니다.

온-프레미스 네트워크와 Microsoft 간에 ExpressRoute 연결을 사용하는 경우 ExpressRoute를 통한 재해 복구를 계획하려면 다음 사항을 고려해야 합니다.

여러 ExpressRoute 회로를 사용하는 문제

둘 이상의 연결을 사용하여 같은 네트워크 세트를 상호 연결하면 네트워크 간에 병렬 경로가 도입됩니다. 병렬 경로가 제대로 설계되지 않으면 비대칭 라우팅이 발생할 수 있습니다. 경로에 NAT 또는 방화벽과 같은 상태 저장 엔터티가 있으면 비대칭 라우팅으로 인해 트래픽 흐름이 차단될 수 있습니다. 일반적으로 NAT 또는 방화벽과 같은 상태 저장 엔터티는 ExpressRoute 개인 피어링 경로를 통해 제공되지 않습니다. 따라서 ExpressRoute 개인 피어링을 통한 비대칭 라우팅이 반드시 트래픽 흐름을 차단하는 것은 아닙니다.

그러나 상태 저장 엔터티가 있는지에 관계없이 지역 중복 병렬 경로에서 트래픽을 부하 분산하면 네트워크 성능이 일관되지 않을 수 있습니다. 이 지역 중복 병렬 경로는 위치별 공급자 페이지에 있는 같은 대도시 또는 다른 대도시를 통과할 수 있습니다.

같은 대도시의 ExpressRoute 회로를 통한 중복성

많은 대도시에 두 개의 ExpressRoute 위치가 있습니다. 예를 들어 AmsterdamAmsterdam2입니다. 중복도를 디자인할 때 같은 대도시에 있는 두 위치를 모두 사용하여 Azure에 대한 두 개의 병렬 경로를 빌드할 수 있습니다. 동일한 공급자를 사용하여 이 작업을 수행하거나 다른 서비스 공급자와 협력하여 복원력을 향상할 수 있습니다. 이 디자인의 또 다른 장점은 애플리케이션 장애 조치가 발생할 때 온-프레미스 애플리케이션과 Microsoft 간의 엔드투엔드 대기 시간이 거의 동일하게 유지된다는 것입니다. 그러나 지진과 같은 자연 재해가 발생하면 두 경로의 연결을 더는 사용할 수 없습니다.

다른 대도시의 ExpressRoute 회로를 통한 중복성

중복도를 위해 다른 대도시를 사용하는 경우 같은 지정학적 지역​​에서 보조 위치를 선택해야 합니다. 지정학적 지역 외부의 위치를 ​​선택하려면 병렬 경로의 두 회로 모두에 프리미엄 SKU를 사용해야 합니다. 이 구성의 장점은 자연 재해로 인해 두 링크가 중단될 가능성이 낮다는 것입니다. 그러나 엔드투엔드 대기 시간은 늘어나는 단점이 있습니다.

참고 항목

ExpressRoute 회로에서 BFD를 사용하도록 설정하면 MSEE(Microsoft Enterprise Edge) 디바이스와 고객/파트너 에지 라우터 간의 연결 오류 검색 속도가 빨라집니다. 그러나 일부 오류 조건에서는 전체 장애 조치(failover) 및 중복 사이트 수렴에 최대 180초가 걸릴 수 있으며 이 시간 동안 더 많은 대기 시간 또는 성능 저하가 발생할 수 있습니다.

이 문서에서는 지역 중복 경로를 구성할 때 발생할 수 있는 문제를 해결하는 방법을 설명해 보겠습니다.

중소규모의 온-프레미스 네트워크 고려 사항

다음 다이어그램에 설명된 예제 네트워크를 살펴보겠습니다. 이 예에서 지역 중복 ExpressRoute 연결은 Contoso의 온-프레미스 위치와 Azure 지역에 있는 Contoso의 VNet 간에 설정됩니다. 다이어그램에서 파란색 실선은 기본 경로(ExpressRoute 1을 통함)를 나타내고 점선은 대기 경로(ExpressRoute 2를 통함)를 나타냅니다.

Diagram of small to medium size on-premises network considerations.

기본적으로 모든 ExpressRoute 경로에 걸쳐 동일하게 경로를 보급하는 경우 Azure는 ECMP(등가 다중 경로) 라우팅을 사용하여 모든 ExpressRoute 경로에서 온-프레미스 바인딩된 트래픽의 부하를 분산합니다.

그러나 지역 중복 ExpressRoute 회로에서는 다른 네트워크 경로(특히 네트워크 대기 시간)를 사용하는 다른 네트워크 성능을 고려해야 합니다. 정상 작동 중에 더 일관된 네트워크 성능을 얻으려면 최소 대기 시간을 제공하는 ExpressRoute 회로를 사용하는 것이 좋습니다.

다음 기술 중 하나를 사용하여 하나의 ExpressRoute 회로를 다른 회로보다 선호하도록 Azure에 영향을 줄 수 있습니다(효율성 순서대로 나열됨).

  • 다른 ExpressRoute 회로와 비교하여 선호하는 ExpressRoute 회로를 통해 더 구체적인 경로 보급
  • 가상 네트워크를 기본 ExpressRoute 회로에 링크하는 연결에서 더 높은 연결 가중치 구성
  • 더 긴 AS 경로(AS 경로가 앞에 추가됨)를 사용하여 덜 선호되는 ExpressRoute 회로를 통해 경로 보급

더 구체적인 경로

다음 다이어그램은 더 구체적인 경로 보급 알림을 사용하여 ExpressRoute 경로 선택에 미치는 영향을 보여줍니다. 설명된 예제에서 Contoso 온-프레미스 /24 IP 범위는 기본 경로(ExpressRoute 1)를 통해 2개의 /25 주소 범위로 보급되고 대기 경로(ExpressRoute 2)를 통해 /24로 보급됩니다.

Diagram of influencing path selection using more specific routes.

/25가 /24보다 더 구체적이기 때문에 Azure는 정상 상태에서 ExpressRoute 1을 통해 10.1.11.0/24로 향하는 트래픽을 보냅니다. ExpressRoute 1의 두 연결이 모두 중단되면 VNet에는 ExpressRoute 2를 통해서만 10.1.11.0/24 경로 보급 알림이 표시됩니다. 따라서 이 실패 상태에서는 대기 회로가 사용됩니다.

연결 가중치

다음 스크린샷은 Azure Portal을 통해 ExpressRoute 연결의 가중치를 구성하는 방법을 보여 줍니다.

Screenshot of configuring connection weight via Azure portal.

다음 다이어그램은 연결 가중치를 사용하여 ExpressRoute 경로 선택에 주는 영향을 보여 줍니다. 기본 연결 가중치는 0입니다. 다음 예제에서는 ExpressRoute 1의 연결 가중치가 100으로 구성됩니다. VNet이 둘 이상의 ExpressRoute 회로를 통해 보급된 경로 접두사를 수신하면 VNet은 가중치가 가장 높은 연결을 선호합니다.

Diagram of influencing path selection using connection weight.

ExpressRoute 1의 두 연결이 모두 중단되면 VNet에는 ExpressRoute 2를 통해서만 10.1.11.0/24 경로 보급 알림이 표시됩니다. 따라서 이 실패 상태에서는 대기 회로가 사용됩니다.

AS 경로 앞에 추가

다음 다이어그램은 AS 경로 앞에 추가를 사용하여 ExpressRoute 경로 선택에 주는 영향을 보여 줍니다. 다이어그램에서 ExpressRoute 1을 통한 경로 보급 알림은 eBGP의 기본 동작을 나타냅니다. ExpressRoute 2를 통한 경로 보급 알림에서 온-프레미스 네트워크의 ASN이 경로의 AS 경로 앞에 추가됩니다. 여러 ExpressRoute 회로를 통해 같은 경로가 수신되면 eBGP 경로 선택 프로세스에 따라 VNet은 AS 경로가 가장 짧은 경로를 선호합니다.

Diagram of influencing path selection using AS path prepend.

ExpressRoute 1의 두 연결이 모두 중단되면 ExpressRoute 2를 통해서만 VNet에 10.1.11.0/24 경로 보급 알림이 표시됩니다. 결과적으로 긴 AS 경로는 적절하지 않습니다. 따라서 이 실패 상태에서는 대기 회로가 사용됩니다.

기술 중 하나를 사용하여 Azure에서 ExpressRoute 중 하나를 선호하도록 영향을 주는 경우, 비대칭 흐름을 방지하도록 온-프레미스 네트워크에서 Azure 바인딩된 트래픽에도 같은 ExpressRoute 경로를 선호하도록 해야 합니다. 일반적으로 로컬 기본 설정값은 하나의 ExpressRoute 회로를 다른 회로보다 선호하도록 온-프레미스 네트워크에 영향을 주는 데 사용합니다. 로컬 기본 설정은 iBGP(내부 BGP) 메트릭입니다. 로컬 기본 설정값이 가장 높은 BGP 경로를 사용하는 것이 좋습니다.

Important

특정 ExpressRoute 회로를 대기 모드로 사용하는 경우 적극적으로 관리하고 주기적으로 장애 조치 작업을 테스트해야 합니다.

대규모 분산 엔터프라이즈 네트워크

대규모 분산 엔터프라이즈 네트워크가 있으면 ExpressRoute 회로가 여러 개일 가능성이 큽니다. 이 섹션에서는 다른 대기 회로가 없어도 활성-활성 ExpressRoute 회로를 사용하여 재해 복구를 디자인하는 방법을 살펴보겠습니다.

다음 다이어그램에 나와 있는 예제를 살펴보겠습니다. 이 예에서 Contoso에는 서로 다른 두 피어링 위치에서 ExpressRoute 회로를 통해 서로 다른 두 Azure 지역에 있는 두 개의 Contoso IaaS 배포에 연결된 두 개의 온-프레미스 위치가 있습니다.

Diagram of large distributed on-premises network considerations.

재해 복구를 설계하는 방식은 지역 간 트래픽이 위치 간 트래픽으로(region1/region2에서 location2/location1로) 라우팅되는 방식에 영향을 줍니다. 교차 지역-위치 트래픽을 다르게 라우팅하는 두 가지 재해 아키텍처를 고려해 보겠습니다.

시나리오 1

첫 번째 시나리오에서는 Azure 지역과 온-프레미스 네트워크 간의 모든 트래픽이 안정된 상태에서 로컬 ExpressRoute 회로를 통과하도록 재해 복구를 디자인해 보겠습니다. 로컬 ExpressRoute 회로가 실패하면 Azure와 온-프레미스 네트워크 간의 모든 트래픽 흐름에 원격 ExpressRoute 회로를 사용합니다.

다음 다이어그램에서는 시나리오 1을 설명합니다. 다이어그램에서 녹색 선은 VNet1과 온-프레미스 네트워크 간의 트래픽 흐름 경로를 나타냅니다. 파란색 선은 VNet2와 온-프레미스 네트워크 간의 트래픽 흐름 경로를 나타냅니다. 실선은 안정적인 상태의 올바른 경로를 나타내고 점선은 안정작인 상태의 트래픽 흐름을 전달하는 해당 ExpressRoute 회로가 실패하는 경우의 트래픽 경로를 나타냅니다.

Diagram of traffic flow for first scenario.

연결 가중치를 사용하여 VNet에서 온-프레미스 네트워크 바인딩된 트래픽에 로컬 피어링 위치 ExpressRoute에 대한 연결을 선호하도록 영향을 미치는 시나리오를 설계할 수 있습니다. 이 솔루션을 완료하려면 트래픽 흐름이 대칭 역방향이어야 합니다. ExpressRoute 회로를 선호하기 위해 온-프레미스 측에서 ExpressRoute 회로가 종료되는 BGP 라우터 사이의 iBGP 세션에서 로컬 기본 설정을 사용할 수 있습니다. 솔루션은 다음 다이어그램에 설명되어 있습니다.

Diagram of active-active ExpressRoute circuits solution 1.

시나리오 2

다음 다이어그램에서는 시나리오 2를 설명합니다. 다이어그램에서 녹색 선은 VNet1과 온-프레미스 네트워크 간의 트래픽 흐름 경로를 나타냅니다. 파란색 선은 VNet2와 온-프레미스 네트워크 간의 트래픽 흐름 경로를 나타냅니다. 안정적인 상태(다이어그램의 실선)에서 Vnet과 온-프레미스 위치 간의 모든 트래픽은 일반적으로 Microsoft 백본을 사용하여 흐르고 ExpressRoute의 실패 상태(다이어그램의 점선)에서만 온-프레미스 위치 간의 상호 연결을 통해 흐릅니다.

Diagram of traffic flow for second scenario.

솔루션은 다음 다이어그램에 설명되어 있습니다. 설명된 대로 더 구체적인 경로(옵션 1)나 AS 경로 앞에 추가(옵션 2)를 사용하여 VNet 경로 선택에 영향을 주는 시나리오를 설계할 수 있습니다. Azure 바인딩된 트래픽의 온-프레미스 네트워크 경로 선택에 영향을 미치려면 온-프레미스 위치 간 상호 연결을 덜 선호하도록 구성해야 합니다. 상호 연결 링크를 선호하도록 구성하는 방법은 온-프레미스 네트워크 내에서 사용되는 라우팅 프로토콜에 따라 다릅니다. iBGP에서 로컬 기본 설정을 사용하거나 IGP(OSPF 또는 IS-IS)에서 메트릭을 사용할 수 있습니다.

Diagram of active-active ExpressRoute circuits solution 2.

Important

하나 이상의 ExpressRoute 회로가 여러 가상 네트워크에 연결된 경우 가상 네트워크 간의 트래픽을 ExpressRoute를 통해 라우팅할 수 있습니다. 그러나 이는 권장되지 않습니다. 가상 네트워크 간의 연결을 사용하도록 설정하려면 가상 네트워크 피어링을 구성합니다.

다음 단계

이 문서에서는 ExpressRoute 회로 개인 피어링 연결의 재해 복구를 디자인하는 방법에 관해 설명합니다. 다음 문서에서는 애플리케이션과 프런트 엔드 액세스 관점에서 재해 복구를 다룹니다.