Azure VMware Solution에 대한 비즈니스 연속성 및 재해 복구

이 엔터프라이즈 규모 시나리오는 BCDR(비즈니스 연속성 및 재해 복구)을 개선하는 데 도움이 됩니다. Azure VMware Solution은 전용 운영 체제 미설치 Azure 인프라에서 빌드된 VMware vSphere 클러스터가 포함된 프라이빗 클라우드를 제공합니다. 이 솔루션은 클러스터당 최소 3개의 ESXi 호스트와 최대 16개의 호스트를 제공합니다. 프로비전된 모든 프라이빗 클라우드에는 VMware vCenter Server, VMware vSAN, VMware vSphere 및 VMware NSX-T Data Center가 있습니다. Azure VMware Solution의 SLA(서비스 수준 약정)에 대해 알아보려면 Azure VMware Solution의 SLA를 참조하세요.

온-프레미스 또는 Azure VMware 솔루션이 있는지 여부에 관계없이 재해에 대비하기 위해 다양한 BCDR 요소를 고려해야 합니다. 강력한 BCDR 계획은 중단 이벤트가 발생할 경우 데이터 손실, 재정적 손실 및 가동 중지 시간으로부터 회사를 보호하는 것을 목표로 합니다. 다음 의사 결정 트리는 Azure VMware Solution에 사용할 수 있는 다양한 BCDR 옵션을 보여줍니다.

Diagram that shows a flow chart for business continuity and disaster recovery.

참고 항목

파일럿 라이트 환경은 최소한의 구성으로 설정되며 중요한 애플리케이션 집합을 지원하는 핵심 구성 요소만 있습니다. 그러나 장애 조치(failover)가 발생하는 경우 더 많은 호스트를 스케일 아웃하고 생성하여 로드의 대부분을 차지할 수 있습니다. 컴퓨팅 및 메모리 집약적 Azure VMware 솔루션 워크로드의 재해 복구를 위해 보조 사이트에 동일한 양의 스토리지가 필요합니다.

비즈니스 연속성 디자인 고려 사항

  • Azure VMware Solution의 VMware vSAN 스토리지 정책은 스토리지 가용성을 염두에 두고 구현됩니다. 클러스터에 3~5개의 호스트가 있는 경우 데이터 손실 없이 허용되는 호스트 오류 수는 1과 같습니다. 클러스터에 6~16개의 호스트가 있는 경우 데이터 손실이 발생하기 전에 허용되는 호스트 오류 수는 2입니다. VMware vSAN 스토리지 정책은 VM별로 적용할 수 있습니다. 이러한 정책이 기본값이지만 정책을 고객 요구 사항에 맞게 수정할 수 있습니다. 자세한 내용은 Azure VMware Solution 스토리지 개념을 참조하세요.

  • vSphere 고가용성은 Azure VMware Solution에서 기본적으로 사용하도록 설정됩니다. 고가용성 허용 정책은 단일 노드에 대한 컴퓨팅 및 메모리 용량을 예약합니다. 이 예약은 Azure VMware Solution 클러스터의 다른 노드에서 워크로드를 다시 시작하기에 충분한 용량을 보장합니다.

  • 확장 클러스터를 사용한 고가용성: Azure VMware Solution에서 표준 vSphere 클러스터에 배포된 ESXi 호스트는 일반적으로 단일 Azure 가용성 영역에 상주하며 vSphere 고가용성으로 보호됩니다. 그러나 워크로드는 가용성 영역 오류로부터 보호되지 않습니다. 오류로부터 보호하기 위해 단일 vSAN 클러스터를 vSAN 확장 클러스터라고 하는 2개의 개별 가용성 영역에 걸쳐 있을 수 있습니다. 자세한 내용은 vSAN 확장 클러스터 배포를 참조하세요.

  • Microsoft Azure Backup Server 또는 파트너 백업 솔루션와 같은 VMware vSphere VM(가상 머신)용으로 검증된 백업 솔루션을 선택합니다.

  • 파트너 백업 솔루션에서 지원되는 기능에 대한 자세한 내용은 해당 파트너 설명서를 참조하세요.

    참고 항목

    프라이빗 클라우드에 대한 vCenter Server 및 NSX-T Data Center 구성은 매시간 백업되며 백업은 3일 동안 유지됩니다.

  • vCenter Server, NSX-T Manager 또는 HCX Manager와 같은 Azure VMware Solution 구성 요소는 Azure에서 백업을 관리하는 관리 서비스입니다. 백업에서 복원하려면 Azure 지원 요청을 만듭니다.

비즈니스 연속성 디자인 권장 사항

  • Azure Backup Server를 사용하여 Azure VMware Solution 프라이빗 클라우드를 백업합니다. 자세한 내용은 Azure Backup을 사용하는 VMware vSphere VM 백업을 참조하세요. 지원되는 배포 토폴로지에는 MARS 에이전트데이터 보호 관리자가 포함됩니다. 각 배포 토폴로지에는 자체 지원 매트릭스, 제약 조건 및 제한 사항이 있습니다.

  • Azure VMware Solution 프라이빗 클라우드와 동일한 Azure 지역에 Azure Backup Server를 배포합니다. 이 배포 방법은 트래픽 비용을 줄이고, 관리를 용이하게 하며, 기본/보조 토폴로지 유지를 수행합니다. Azure 지역 배포 모범 사례에 대한 Azure 지역 선택 가이드를 참조하세요.

  • Azure Backup는 Azure IaaS(Infrastructure as a Service) VM으로 또는 Azure VMware Solution 프라이빗 클라우드 내에 배포할 수 있습니다. Azure VMware Solution 프라이빗 클라우드 외부에 배포하는 것이 좋습니다. Azure 가상 네트워크에 백업을 배포하고 이 가상 네트워크가 Azure VMware Solution 프라이빗 클라우드에 연결된 동일한 ExpressRoute에 연결되어 있는지 확인합니다. Azure VMware Solution 프라이빗 클라우드 외부에서 백업 서버를 실행하면 vSAN이 Azure VMware Solution 프라이빗 클라우드 내에서 제한된 용량 리소스이므로 vSAN 사용량을 줄이는 데 도움이 됩니다.

    Azure Backup Server가 Azure IaaS VM으로 배포되었습니다.

    Diagram that shows Azure Backup Server deployed as an Azure IaaS VM.

    Azure Backup Server가 Azure VMware Solution VM으로 배포되었습니다.

    Diagram that shows Azure Backup Server deployed as an Azure VMware Solution VM.

  • 애플리케이션 성능 요구사항 체크리스트를 사용하여 HDD, SSD 또는 Ultra와 같은 올바른 용량 및 디스크 유형을 선택합니다. 백업 작업에 대한 디스크 유형 및 용량을 지원하는 Azure IaaS VM SKU를 고려합니다.

  • Azure Backup Server 용량 플래너를 사용하여 서버 수, 스토리지 및 각각에 대한 IOPS 요구사항을 결정합니다. Capacity Planner에서 "총 워크로드 크기(GB)*" 값을 제공하는 경우 백업하려는 vCenter의 모든 VM에 대해 "사용된 스토리지"와 "할당된 스토리지" 사이의 중앙값을 사용합니다.

  • 향상된 디스크 IOPS/처리량을 위해 Azure Backup Server와 함께 스토리지 풀을 사용합니다. 향상된 작업을 위해 Backup Server에서 계층화된 스토리지를 사용합니다. 전체 성능 계층을 사용하여 ReFS 메타데이터를 저장할 수 있도록 MABS 볼륨에서 DisableWriteAutoTiering 구성 값을 1로 설정합니다.

  • Azure Backup 서버에서 실행할 병렬 백업 작업 및 복원 작업의 수를 식별합니다. 현재 8개의 병렬 백업 작업이 지원됩니다. 여러 실행에서 중요 업무용 워크로드를 백업하고 복원하는 데 걸리는 시간을 측정합니다. 백업 및 복원 시간이 Azure Backup 서버에 대한 RPO 및 RTO 요구 사항을 충족하는지 확인합니다. AVS vSAN 데이터 저장소에 복원된 백업을 저장할 충분한 용량이 있는지 확인합니다.

  • Azure Backup Server에서 바이러스 백신/맬웨어 방지 소프트웨어가 실행되는 경우 여기에 설명된 대로 Azure Backup Server 파일 및 폴더에 필요한 바이러스 백신 예외를 추가합니다. 애플리케이션 백업(예: SQL, Sharepoint 등)을 위해 Azure VMware Solution VM에서 DPM 보호 에이전트를 사용하는 경우 dpmra.exe 실시간 모니터링을 사용하지 않도록 설정합니다.

  • Azure VMware Solution의 보호된 VM에서 실행되는 DPM 보호 에이전트의 네트워크 통신을 허용하도록 서브넷 호스팅 Azure Backup Server에 적절한 NSG(네트워크 보안 그룹) 규칙을 구성합니다. DPM 보호 에이전트는 1024에서 65535 사이의 동적 포트에서 Azure Backup Server와 통신합니다.

  • 현재 Azure Backup Server는 Azure VMware Solution 프라이빗 클라우드에 대한 지역 간 복원을 지원하지 않습니다. 지역 간 Azure VMware Solution 복구가 필요한 경우 파트너 백업 솔루션재해 복구 섹션을 참조하세요.

재해 복구 디자인 고려 사항

  • 애플리케이션에 대한 RTO(복구 시간 목표), 용량 및 RPO(복구 지점 목표)에 비즈니스 요구 사항을 맞춥니다. 가장 적절한 복제 기술을 사용하여 이러한 목표를 달성하기 위해 적절하게 계획하고 디자인합니다. 예를 들어 기본적으로 SQL Always On 가용성 그룹을 사용하여 SQL 데이터베이스를 복제하거나 VMware Site Recovery Manager와 같은 재해 복구 도구를 사용합니다.

  • 보호된 Azure VMware Solution 프라이빗 클라우드의 대상 재해 복구 사이트를 결정합니다. 이 사이트는 환경에 적합한 재해 복구 도구에 영향을 줍니다. 예를 들어 Azure VMware Solution 워크로드를 Azure 네이티브 IaaS 가상 머신으로 복구하려는 경우 Azure Site Recovery 또는 Zerto를 고려할 있습니다.

  • 재해 복구 이벤트가 있는 경우 보호가 필요한 Azure VMware Solution 워크로드의 하위 집합을 결정합니다. 중요 비즈니스용 워크로드의 경우 P0, 중요하지만 비즈니스 운영에 중요하지 않은 다른 워크로드의 경우 P1, P2, P3 등 우선 순위에 따라 워크로드를 분류하는 것이 좋습니다. 고객의 비즈니스 연속성 계획은 재해 복구 구현과 관련된 비용을 관리하는 데 도움이 되는 우선 순위 수준을 정의합니다.

  • 대부분의 경우 개발, 테스트 또는 UAT와 같은 비프로덕션 환경에서는 보조 사이트로 장애 조치(failover)할 필요가 없습니다. 비용을 절감하려면 프로덕션 및 중요 워크로드에 대한 용량이 감소된 보조 사이트에서 파일럿 라이트를 실행해야 합니다. 더 많은 용량을 위해 재해 복구 이벤트 중에 클러스터에 ESXi 호스트를 추가하도록 스케일 아웃할 수 있습니다.

  • 특히 파일럿 라이트 배포의 경우 전체 확장 중에 필요한 용량을 기다릴 필요가 없도록 보조 사이트에 필요한 모든 호스트 할당량을 확보했는지 확인합니다. Azure VMware Solution에 대한 호스트 할당량 요청을 참조하세요.

  • 보조 환경에서 Active Directory 도메인 컨트롤러와 같은 기능 도메인 역할을 설정합니다.

  • JetStream 및 Zerto와 같은 파트너의 솔루션은 일반 공급되며 Azure VMware Solution에서 유효성이 검사되었습니다. 대부분의 재해 복구 시나리오를 지원하고 0에 가까운 RPO로 더 빠른 복구를 제공할 수 있습니다.

  • VMware Site Recovery Manager, Jetstream 및 Zerto는 타사 위치에서 Azure VMware Solution으로의 마이그레이션을 지원합니다.

  • VMware HCX는 비용 효율적인 재해 복구 솔루션이기도 합니다. 그러나 수동 오케스트레이션으로 인해 대규모 프로덕션 워크로드에는 권장되지 않습니다.

  • 다른 Azure 지역의 Azure VMware Solution 프라이빗 클라우드 간에 재해 복구를 위해 두 백 엔드 ExpressRoute 회로 간에 ExpressRoute Global Reach를 사용하도록 설정해야 합니다. 이러한 회로는 VMware SRM 및 VMware HCX와 같은 솔루션에 필요한 경우 기본 및 보조 프라이빗 클라우드 연결을 만듭니다.

  • 동일한 Azure 지역의 Azure VMware Solution 프라이빗 클라우드 간의 재해 복구를 위해 Azure VMware Solution 상호 연결을 활성화해야 합니다. 클라우드 간의 통신을 위해 Azure VMware Solution 프라이빗 클라우드의 관리 및 워크로드 네트워크 사이에 라우팅 링크를 만듭니다. 각 프라이빗 클라우드의 라우팅된 IP 주소 공간이 고유하고 겹치지 않는지 확인합니다.

  • 재해 복구 작업 시 기본 Azure 지역과 보조 Azure 지역에서 동일한 원본 IP 주소 공간을 사용할 수 있습니다. 그러나 추가 디자인 및 엔지니어링 작업이 필요합니다.

    • 동일한 IP 주소 유지: 보조 Azure VMware Solution 사이트의 가상 머신은 기본 사이트와 동일한 원본 IP 주소를 사용하여 복구할 수 있습니다. 이 방법의 경우 보조 사이트에서 격리된 VLAN 또는 NSX-T 세그먼트를 만들고 이렇게 격리된 VLAN 또는 세그먼트가 환경에 연결되어 있지 않은지 확인합니다. 서브넷이 보조 사이트 및 새 IP 주소 위치로 이동했음을 반영하도록 재해 복구 경로를 수정합니다. 이 방법은 효과가 있지만 완전히 자동화된 재해 복구를 목표로 하는 경우 엔지니어링 오버헤드도 발생합니다.

    • 다른 IP 주소를 사용: 복구된 VM에 다른 IP 주소를 사용할 수도 있습니다. VM이 보조 사이트로 이동되면 VMware 사이트 복구 관리자 내의 복구 계획이 사용자 지정 IP 맵을 자세히 설명합니다. IP 주소를 변경하려면 이 맵을 선택하세요. VM은 새 NSX-T 세그먼트에서 가져오고 새 IP 주소가 할당됩니다. 이 도구는 다양한 재해 복구 솔루션에 따라 다를 수 있습니다.

  • 부분 및 전체 재해 복구 시나리오의 중요한 요소:

    • VMware Site Recovery Manager는 가상 시스템의 하위 집합만 복구하는 부분 복구와 전체 재해 복구를 지원합니다. 지역 1과 지역 2의 두 Azure VMware Solution 사이트 간에 VM의 전체 또는 일부가 장애 조치(failover)될 수 있습니다.

    • 복구된 VM에 대한 원본 IP 주소 보존 요구 사항에 따라 부분 재해 복구와 전체 재해 복구가 가능한지 여부가 결정됩니다.

    • Site Recovery Manager에서 부분 재해 복구를 수행하는 동안 원본 IP 주소를 유지 관리하려면 서브넷 게이트웨이가 보조 사이트로 이동해야 합니다.

    참고 항목

    액티브-대기 재해 복구에는 레이어 2 스트레칭이 필요하지 않습니다.

재해 복구 디자인 권장 사항

  • 기본 사이트와 보조 사이트 모두에서 Azure VMware Solution으로 작업할 때 VMware Site Recovery Manager를 사용합니다. 기본 사이트와 보조 사이트를 각각 보호된 사이트와 복구 사이트라고도 합니다.

    연속 vSphere 복제에 대한 개략적인 개요.

    Diagram that shows a high-level example of continuous vSphere replication between two Azure VMware Solution sites.

    기본 사이트와 보조 사이트 간의 연속 vSphere 복제에 대한 자세한 예.

    Diagram that shows a detailed example of continuous vSphere replication between two Azure VMware Solution sites.

  • 중요 비즈니스용 애플리케이션의 경우 Zerto 및 JetStream을 Azure VMware Solution 프라이빗 클라우드에 대한 재해 복구 솔루션으로 사용할 수 있습니다. JetStream 및 Zerto는 데이터 손실을 최소화하거나 데이터 손실이 거의 없는 VMware VAIO(vSphere API for I/O) 프레임워크를 사용하는 CDP(연속 데이터 보호)를 기반으로 빌드됩니다. 또한 최소한의 리소스를 사용하여 비용 효율적인 재해 복구를 가능하게 합니다.

  • Azure IaaS 가상 머신이 Azure VMware Solution 프라이빗 클라우드의 재해 복구 대상인 경우 Azure Site Recovery 또는 Zerto를 사용합니다.

  • 각 재해 복구 솔루션 내에서 자동화된 복구 계획을 사용하여 수동 입력을 최소화합니다. 이러한 계획은 VMware Site Recovery Manager 또는 파트너 솔루션으로 작업할 때 유용합니다. 복구 계획은 장애 조치를 위해 컴퓨터를 복구 그룹으로 수집합니다. 그런 다음 장애 조치(failover)할 수 있는 독립 단위를 만들어 체계적인 복구 프로세스를 정의하는 데 도움이 됩니다.

  • 연 1회 이상 스모크 테스트 또는 재해 복구 훈련을 설정하여 복구 계획이 예상대로 작동하는지 확인합니다. 선택한 재해 복구 도구의 오케스트레이션 기능은 이러한 훈련 실행과 관련된 노력 수준을 결정합니다.

  • 지정학적 지역별 쌍을 보조 재해 복구 환경으로 사용합니다. 지역 쌍의 이점 중 일부로는 우선 순위가 지정된 지역 복구, 순차적 업데이트, 물리적 격리 및 데이터 상주 등이 있습니다.

  • 두 사이트 간에 IP 주소가 겹치지 않도록 주소 공간을 다르게 유지합니다. 예를 들어 지역 1에는 192.168.0.0/16을 사용하고 지역 2에는 10.0.0.0/16을 사용합니다.

  • 서로 다른 지역의 기본 및 보조 프라이빗 클라우드 간에 ExpressRoute Global Reach 연결을 사용합니다. 관련 디자인 영역에서 더 많은 네트워킹 고려 사항 및 권장 사항을 참조하세요.

다음 단계

Azure VMware Solution의 초기 배포에 대한 고려 사항 및 권장 사항과 운영 자동화 지침에 대해 알아보세요.