Azure 간 재해 복구 아키텍처

이 문서에서는 Azure Site Recovery 서비스를 사용하여 Azure VM(가상 머신)에 대한 재해 복구를 배포할 때 사용되는 아키텍처, 구성 요소 및 프로세스에 대해 설명합니다. 재해 복구를 설정하면 Azure VM이 다른 대상 지역에 지속적으로 복제됩니다. 중단이 발생하는 경우 VM을 보조 지역으로 장애 조치하고, 해당 지역에서 액세스할 수 있습니다. 모든 항목이 정상적으로 다시 실행되면 장애 복구(failback)하고 기본 위치에서 작업을 계속할 수 있습니다.

아키텍처 구성 요소

Azure VM의 재해 복구와 관련된 구성 요소는 다음 표에 요약되어 있습니다.

구성 요소 요구 사항
원본 지역의 VM 지원되는 원본 지역에 있는 더 많은 Azure VM 중 하나입니다.

VM은 지원되는 모든 운영 체제를 실행할 수 있습니다.
원본 VM 스토리지 Azure VM은 관리될 수 있습니다. 또는 스토리지 계정에 분산된 관리되지 않는 디스크를 가집니다.

지원되는 Azure Storage에 대해 알아봅니다.
원본 VM 네트워크 VM은 원본 지역의 VNet(가상 네트워크)에서 하나 이상의 서브넷에 있을 수 있습니다. 네트워킹 요구 사항에 대해 자세히 알아보세요.
캐시 스토리지 계정 원본 네트워크에 캐시 스토리지 계정이 필요합니다. 복제본(replica) 중에 VM 변경 내용은 대상 스토리지로 전송되기 전에 캐시에 저장됩니다. 캐시 스토리지 계정은 표준이어야 합니다.

캐시를 사용하여 VM에서 실행 중인 프로덕션 애플리케이션에 미치는 영향이 최소화됩니다.

캐시 스토리지 요구 사항에 대해 자세히 알아봅니다.
대상 리소스 대상 리소스는 복제본(replica) 중에 사용되며 장애 조치(failover)가 발생할 때 사용됩니다. Site Recovery는 기본적으로 대상 리소스를 설정하거나 만들거나 사용자 지정할 수 있습니다.

대상 지역에서 VM을 만들 수 있고 구독에 대상 지역에 필요한 VM 크기를 지원하기에 충분한 리소스가 있는지 검사.

Diagram showing source and target replication.

대상 리소스

VM의 복제를 활성화하면 Site Recovery는 대상 리소스를 자동으로 만들기 위한 옵션을 제공합니다.

대상 리소스 기본 설정
대상 구독 원본 구독과 동일합니다.
대상 리소스 그룹 장애 조치(failover) 후 VM이 속한 리소스 그룹입니다.

원본 지역을 제외한 모든 Azure 지역일 수 있습니다.

Site Recovery는 "asr" 접미사를 사용하여 대상 지역에 새 리소스 그룹을 만듭니다.
대상 VNet 장애 조치(failover) 후 복제본(replica)ted VM이 있는 VNet(가상 네트워크)입니다. 네트워크 매핑은 원본 및 대상 가상 네트워크 간에 생성되며 그 반대의 경우도 마찬가지입니다.

Site Recovery는 "asr" 접미사를 사용하여 새 VNet 및 서브넷을 만듭니다.
대상 스토리지 계정 VM에서 관리 디스크를 사용하지 않는 경우 데이터가 복제되는 스토리지 계정입니다.

Site Recovery는 대상 지역에 새 스토리지 계정을 만들어 원본 스토리지 계정을 미러.
복제 관리 디스크 VM에서 관리 디스크를 사용하는 경우 데이터가 복제되는 관리 디스크입니다.

Site Recovery는 스토리지 지역에 복제본(replica) 관리 디스크를 만들어 원본을 미러.
대상 가용성 집합 장애 조치(failover) 후 복제본(replica) VM이 있는 가용성 집합입니다.

Site Recovery는 원본 위치의 가용성 집합에 있는 VM에 대해 "asr" 접미사를 사용하여 대상 지역에 가용성 집합을 만듭니다. 가용성 집합이 있는 경우 가용성 집합이 사용되며 새로 생성되지 않습니다.
대상 가용성 영역 대상 지역에서 가용성 영역을 지원하는 경우 Site Recovery는 원본 지역에 사용된 동일한 영역 번호를 할당합니다.

대상 리소스 관리

다음과 같이 대상 리소스를 관리할 수 있습니다.

  • 복제본(replica) 설정을 사용하도록 설정하면 대상 설정을 수정할 수 있습니다. 대상 지역 VM의 기본 SKU는 원본 VM의 SKU(또는 원본 VM SKU에 비해 사용 가능한 다음 SKU)와 동일합니다. 드롭다운 목록에는 원본 VM(Gen 1 또는 Gen 2)과 동일한 제품군의 관련 SKU만 표시됩니다.
  • 복제본(replica)tion이 이미 작동한 후 대상 설정을 수정할 수 있습니다. 대상 리소스 그룹, 대상 이름 등과 같은 다른 리소스와 마찬가지로, 복제본(replica) 진행 중인 후에 대상 지역 VM SKU를 업데이트할 수도 있습니다. 업데이트할 수 없는 리소스는 가용성 유형(단일 인스턴스, 집합 또는 영역)입니다. 이 설정을 변경하려면 복제를 비활성화하고, 설정을 수정한 다음, 다시 활성화해야 합니다.

복제 정책

Azure VM 복제를 활성화하면 기본적으로 Site Recovery는 표에 요약된 기본 설정을 사용하여 새 복제 정책을 만듭니다.

정책 설정 세부 정보 기본값
복구 지점 보존 Site Recovery에서 복구 지점을 유지하는 기간을 지정합니다. 하루
앱 일치 스냅샷 빈도 Site Recovery에서 앱 일치 스냅샷을 만드는 주기입니다. 0시간(사용 안 함)

복제본(replica) 정책 관리

다음과 같이 기본 복제 정책의 설정을 관리하고 수정할 수 있습니다.

  • 복제를 사용하도록 설정하면 설정을 수정할 수 있습니다.
  • 언제든지 복제 정책을 만든 다음, 복제를 활성화할 때 적용할 수 있습니다.

참고 항목

복구 지점 보존 기간이 길면 더 많은 복구 지점을 저장해야 하므로 스토리지 비용에 영향을 줄 수 있습니다.

다중 VM 일관성

VM을 함께 복제본(replica) 장애 조치(failover)에서 크래시 일관성 및 앱 일치 복구 지점을 공유하려는 경우 복제본(replica) 그룹으로 함께 수집할 수 있습니다. 다중 VM 일관성은 워크로드 성능에 영향을 줍니다. 모든 컴퓨터에서 일관성이 필요한 워크로드를 실행하는 VM에만 사용해야 합니다.

스냅샷 및 복구 지점

복구 지점은 특정 시점에 생성되는 VM 디스크의 스냅샷에서 생성됩니다. VM을 장애 조치(failover)할 때 복구 지점을 사용하여 대상 위치에서 VM을 복원합니다.

장애 조치(failover)할 때 일반적으로 손상 또는 데이터 손실 없이 VM을 시작하고, VM 데이터가 운영 체제 및 VM에서 실행되는 앱에 대해 일관되는지 확인하려고 합니다. 이는 수행된 스냅샷 유형에 따라 달라집니다.

Site Recovery는 다음과 같이 스냅샷을 생성합니다.

  1. Site Recovery는 기본적으로 데이터의 크래시 일치 스냅샷, 빈도를 지정하는 경우 앱 일치 스냅샷 사용합니다.
  2. 복구 지점은 스냅샷 생성되고 복제본(replica)tion 정책의 보존 설정에 따라 저장됩니다.

일관성

다음 표에서는 다양한 유형의 일관성에 대해 설명합니다.

크래시 일관성

설명 세부 정보 권장
크래시 일관성 스냅샷은 스냅샷을 만들 때 디스크에 있는 데이터를 캡처합니다. 메모리에 아무것도 포함되지 않습니다.

여기에는 VM이 충돌하거나 스냅샷 가져오는 즉시 서버에서 전원 코드를 끌어온 경우 표시되는 디스크 내 데이터와 동등한 데이터가 포함됩니다.

크래시 일관성은 운영 체제 또는 VM의 앱에 대한 데이터 일관성을 보장하지 않습니다.
Site Recovery는 기본적으로 5분마다 크래시 일치 복구 지점을 만듭니다. 이 설정은 수정할 수 없습니다.

오늘날 대부분의 앱은 크래시 일관성 지점에서 잘 복구할 수 있습니다.

크래시 일관성 복구 지점은 일반적으로 운영 체제의 복제본(replica) 및 DHCP 서버 및 인쇄 서버와 같은 앱에 충분합니다.

앱 일치

설명 세부 정보 권장
앱 일치 복구 지점은 앱 일치 스냅샷에서 생성됩니다.

앱 일치 스냅샷 크래시 일관성 스냅샷 모든 정보와 진행 중인 메모리 및 트랜잭션의 모든 데이터를 포함합니다.
앱 일치 스냅샷 VSS(볼륨 섀도 복사본 서비스)를 사용합니다.

1) Azure Site Recovery는 Microsoft SQL의 트랜잭션 로그 백업 시간 및 시퀀스 번호를 변경하지 않는 복사 전용 백업(VSS_BT_COPY) 메서드를 사용합니다.

2) 스냅샷이 시작될 때 VSS는 볼륨에서 복사-쓰기(COW) 작업을 수행합니다.

3) COW를 수행하기 전에 VSS는 컴퓨터의 모든 앱에 메모리 상주 데이터를 디스크에 플러시해야 한다고 알릴 수 있습니다.

4) VSS를 사용하면 백업/재해 복구 앱(이 경우 Site Recovery)에서 스냅샷 데이터를 읽고 계속 진행할 수 있습니다.
앱 일치 스냅샷 지정한 빈도에 따라 수행됩니다. 이 빈도는 항상 복구 지점을 유지하기 위해 설정한 것보다 적어야 합니다. 예를 들어 기본 설정인 24시간을 사용하여 복구 지점을 유지하는 경우 빈도를 24시간 미만으로 설정해야 합니다.

크래시 일관성 스냅샷보다 더 복잡하며 완료하는 데 시간이 더 걸립니다.

복제본(replica) 사용하도록 설정된 VM에서 실행되는 앱의 성능에 영향을 줍니다.

복제 프로세스

Azure VM에 대해 복제본(replica)tion을 사용하도록 설정하면 다음이 발생합니다.

  1. Site Recovery Mobility Service 확장은 VM에 자동으로 설치됩니다.
  2. 확장은 Site Recovery에 VM을 등록합니다.
  3. VM에 대한 연속 복제본(replica) 시작됩니다. 디스크 쓰기는 원본 위치의 캐시 스토리지 계정으로 즉시 전송됩니다.
  4. Site Recovery는 캐시의 데이터를 처리하고 대상 스토리지 계정 또는 복제본(replica) 관리 디스크로 보냅니다.
  5. 데이터가 처리되면 5분마다 크래시 일치 복구 지점이 생성됩니다. 앱 일치 복구 지점은 복제본(replica) 정책에서 지정한 설정에 따라 생성됩니다.

Diagram showing the replication process, step 2.

복제 프로세스

연결 요구 사항

복제본(replica) Azure VM에는 아웃바운드 연결이 필요합니다. Site Recovery는 VM에 대한 인바운드 연결이 필요하지 않습니다.

아웃바운드 연결(URL)

VM에 대한 아웃바운드 액세스가 URL로 제어되는 경우 이러한 URL을 허용합니다.

이름 상업용 정부 설명
스토리지 *.blob.core.windows.net *.blob.core.usgovcloudapi.net VM에서 원본 지역의 캐시 스토리지 계정에 데이터를 쓸 수 있도록 합니다.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Site Recovery 서비스 URL에 대한 권한 부여 및 인증을 제공합니다.
복제 *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us VM이 Site Recovery 서비스와 통신할 수 있도록 합니다.
Service Bus *.servicebus.windows.net *.servicebus.usgovcloudapi.net VM이 Site Recovery 모니터링 및 진단 데이터를 쓸 수 있도록 합니다.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net 포털을 통해 ADE 사용 가상 머신에 대한 복제본(replica)tion을 사용하도록 액세스를 허용합니다.
Azure Automation *.automation.ext.azure.com *.azure-automation.us 포털을 통해 복제본(replica)ted 항목에 대해 모바일 에이전트의 자동 업그레이드를 사용하도록 설정할 수 있습니다.

IP 주소 범위에 대한 아웃바운드 연결

IP 주소를 사용하여 VM에 대한 아웃바운드 연결을 제어하려면 다음 주소를 허용합니다. 네트워크 연결 요구 사항에 대한 자세한 내용은 네트워킹 백서에서 확인할 수 있습니다.

원본 지역 규칙

규칙 세부 정보 서비스 태그
HTTPS 아웃바운드 허용: 포트 443 원본 지역의 스토리지 계정에 해당하는 범위 허용 Storage.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Microsoft Entra ID에 해당하는 범위 허용 AzureActiveDirectory
HTTPS 아웃바운드 허용: 포트 443 대상 지역의 이벤트 허브에 해당하는 범위를 허용합니다. EventHub.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Azure Site Recovery에 해당하는 범위 허용 AzureSiteRecovery
HTTPS 아웃바운드 허용: 포트 443 Azure Key Vault에 해당하는 범위 허용(포털을 통해 ADE 사용 가상 머신의 복제본(replica)을 사용하도록 설정하는 데만 필요함) AzureKeyVault
HTTPS 아웃바운드 허용: 포트 443 Azure Automation 컨트롤러에 해당하는 범위를 허용합니다(포털을 통해 복제된 항목에 대한 모바일 에이전트의 자동 업그레이드를 사용하도록 설정하는 데만 필요). GuestAndHybridManagement

대상 지역 규칙

규칙 세부 정보 서비스 태그
HTTPS 아웃바운드 허용: 포트 443 대상 지역의 스토리지 계정에 해당하는 범위 허용 Storage.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Microsoft Entra ID에 해당하는 범위 허용 AzureActiveDirectory
HTTPS 아웃바운드 허용: 포트 443 원본 지역의 이벤트 허브에 해당하는 범위를 허용합니다. EventHub.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Azure Site Recovery에 해당하는 범위 허용 AzureSiteRecovery
HTTPS 아웃바운드 허용: 포트 443 Azure Key Vault에 해당하는 범위 허용(포털을 통해 ADE 사용 가상 머신의 복제본(replica)을 사용하도록 설정하는 데만 필요함) AzureKeyVault
HTTPS 아웃바운드 허용: 포트 443 Azure Automation 컨트롤러에 해당하는 범위를 허용합니다(포털을 통해 복제된 항목에 대한 모바일 에이전트의 자동 업그레이드를 사용하도록 설정하는 데만 필요). GuestAndHybridManagement

NSG 규칙을 사용하여 액세스 제어

NSG 규칙을 사용하여 Azure 네트워크/서브넷 간에 네트워크 트래픽을 필터링하여 VM 연결을 제어하는 경우 다음 요구 사항을 확인합니다.

  • 원본 Azure 지역에 대한 NSG 규칙은 복제본(replica) 트래픽에 대한 아웃바운드 액세스를 허용해야 합니다.
  • 프로덕션 환경에 배치하기 전에 테스트 환경에서 규칙을 만드는 것이 좋습니다.
  • 개별 IP 주소를 허용하는 대신 서비스 태그를 사용합니다.
    • 서비스 태그는 보안 규칙을 만들 때 복잡성을 최소화하기 위해 함께 수집된 IP 주소 접두사 그룹을 나타냅니다.
    • Microsoft는 시간이 지남에 따라 서비스 태그를 자동으로 업데이트합니다.

Site Recovery에 대한 아웃바운드 연결NSG를 사용하여 연결 제어에 대해 자세히 알아봅니다.

다중 VM 일관성에 대한 커넥트ivity

다중 VM 일관성을 사용하도록 설정하면 복제 그룹의 컴퓨터는 20004 포트를 통해 서로 통신하게 됩니다.

  • 포트 20004를 통해 VM 간의 내부 통신을 차단하는 방화벽 어플라이언스 없는지 확인합니다.
  • Linux VM이 복제본(replica)tion 그룹의 일부가 되도록 하려면 특정 Linux 버전의 지침에 따라 포트 20004의 아웃바운드 트래픽이 수동으로 열리는지 확인합니다.

장애 조치(failover) 프로세스

장애 조치(failover)를 시작하면 대상 리소스 그룹, 대상 가상 네트워크, 대상 서브넷 및 대상 가용성 집합에 VM이 만들어집니다. 장애 조치(failover) 중에는 모든 복구 지점을 사용할 수 있습니다.

Diagram showing the failover process with source and target environments.

다음 단계

Azure VM을 보조 지역에 신속하게 복제본(replica).