Azure 간 재해 복구 아키텍처

이 문서에서는 Azure Site Recovery 서비스를 사용하여 Azure VM(가상 머신)에 대한 재해 복구를 배포할 때 사용되는 아키텍처, 구성 요소 및 프로세스에 대해 설명합니다. 재해 복구를 설정하면 Azure VM이 다른 대상 지역에 지속적으로 복제됩니다. 중단이 발생하는 경우 VM을 보조 지역으로 장애 조치하고, 해당 지역에서 액세스할 수 있습니다. 모두 정상적으로 다시 실행 중인 경우 다시 장애 복구하고 기본 위치에서 작업을 계속할 수 있습니다.

아키텍처 구성 요소

Azure VM에 대한 재해 복구에 관련된 구성 요소는 다음 표에 요약되어 있습니다.

구성 요소 요구 사항
원본 지역의 VM 지원되는 원본 지역에서 하나 이상의 Azure VM입니다.

VM은 지원되는 운영 체제에서 실행될 수 있습니다.
원본 VM 스토리지 Azure VM은 관리될 수 있거나 스토리지 계정에 분산된 비관리형 디스크를 포함합니다.

지원되는 Azure 스토리지에 대해 자세히 알아봅니다.
원본 VM 네트워크 VM은 원본 지역의 VNet(가상 네트워크)에서 하나 이상의 서브넷에 있을 수 있습니다. 네트워킹 요구 사항에 대해 자세히 알아봅니다.
캐시 스토리지 계정 원본 네트워크에서 캐시 스토리지 계정이 필요합니다. 복제 중 VM 변경 내용이 대상 스토리지로 전송되기 전에 캐시에 저장됩니다.

캐시를 사용하여 VM에서 실행 중인 프로덕션 애플리케이션에 미치는 영향이 최소화됩니다.

캐시 스토리지 요구 사항에 대해 자세히 알아봅니다.
대상 리소스 대상 리소스는 복제하는 동안 및 장애 조치(failover)가 발생하는 경우에 사용됩니다. Site Recovery는 기본적으로 대상 리소스를 설정할 수 있습니다. 또는 사용자가 만들거나 사용자 지정할 수 있습니다.

대상 지역에서 VM을 만들 수 있는지, 구독에 대상 지역에 필요한 VM 크기를 지원하기 위해 충분한 리소스가 있는지 확인합니다.

원본 및 대상 복제를 보여 주는 다이어그램입니다.

대상 리소스

VM의 복제를 활성화하면 Site Recovery는 대상 리소스를 자동으로 만들기 위한 옵션을 제공합니다.

대상 리소스 기본 설정
대상 구독 원본 구독과 동일합니다.
대상 리소스 그룹 장애 조치(failover) 후 VM이 속하게 되는 리소스 그룹입니다.

원본 지역을 제외한 모든 Azure 지역일 수 있습니다.

Site Recovery는 "asr" 접미사를 사용하여 대상 지역에 새 리소스 그룹을 만듭니다.
대상 VNet 장애 조치(failover) 후 복제된 VM이 있는 VNet(가상 네트워크)입니다. 네트워크 매핑은 원본 및 대상 가상 네트워크 간에 만들어집니다.

Site Recovery는 "asr" 접미사를 사용하여 새 VNet 및 서브넷을 만듭니다.
대상 스토리지 계정 VM에서 관리 디스크를 사용하지 않는 경우 데이터가 복제되는 스토리지 계정입니다.

Site Recovery는 대상 지역에 새 스토리지 계정을 만들어서 원본 스토리지 계정을 미러링합니다.
복제 관리 디스크 VM에서 관리 디스크를 사용하는 경우 데이터가 복제되는 관리 디스크입니다.

Site Recovery는 원본을 미러링하는 스토리지 영역에서 관리 디스크의 복제본을 만듭니다.
대상 가용성 집합 장애 조치(failover) 후 복제된 VM이 있는 가용성 집합입니다.

Site Recovery는 원본 위치의 가용성 집합에 있는 VM에 대해 "asr" 접미사를 사용하여 대상 지역에 가용성 집합을 만듭니다. 가용성 집합이 있는 경우 가용성 집합이 사용되며 새로 생성되지 않습니다.
대상 가용성 영역 대상 지역에서 가용성 영역을 지원하는 경우 Site Recovery는 원본 지역에 사용된 동일한 영역 번호를 할당합니다.

대상 리소스 관리

다음과 같이 대상 리소스를 관리할 수 있습니다.

  • 복제를 사용하도록 설정하면 대상 설정을 수정할 수 있습니다. 대상 지역 VM에 대한 기본 SKU는 원본 VM의 SKU(또는 원본 VM SKU와 비교하여 다음으로 가장 좋은 사용 가능한 SKU)와 동일합니다. 드롭다운 목록에는 원본 VM(Gen 1 또는 Gen 2)과 동일한 제품군의 관련 SKU만 표시됩니다.
  • 복제가 작동한 후 대상 설정을 수정할 수 있습니다. 대상 리소스 그룹, 대상 이름 등과 같은 다른 리소스와 유사하게 복제가 진행 중인 후에 대상 지역 VM SKU를 업데이트할 수도 있습니다. 업데이트할 수 없는 리소스는 가용성 유형(단일 인스턴스, 집합 또는 영역)입니다. 이 설정을 변경하려면 복제를 비활성화하고, 설정을 수정한 다음, 다시 활성화해야 합니다.

복제 정책

Azure VM 복제를 활성화하면 기본적으로 Site Recovery는 표에 요약된 기본 설정을 사용하여 새 복제 정책을 만듭니다.

정책 설정 세부 정보 기본값
복구 지점 보존 Site Recovery에서 복구 지점을 유지하는 기간을 지정합니다. 1일
앱 일치 스냅샷 빈도 Site Recovery에서 앱 일치 스냅샷을 만드는 주기입니다. 0시간(사용 안 함)

복제 정책 관리

다음과 같이 기본 복제 정책의 설정을 관리하고 수정할 수 있습니다.

  • 복제를 사용하도록 설정하면 설정을 수정할 수 있습니다.
  • 언제든지 복제 정책을 만든 다음, 복제를 활성화할 때 적용할 수 있습니다.

참고 항목

복구 지점 보존 기간이 길면 더 많은 복구 지점을 저장해야 하므로 스토리지 비용에 영향을 줄 수 있습니다.

다중 VM 일관성

VM을 함께 복제하고, 장애 조치(failover) 시 공유 크래시 일관성 및 앱 일치 복구 지점을 가지려는 경우 복제 그룹으로 함께 수집할 수 있습니다. 다중 VM 일관성은 워크로드 성능에 영향을 미치며, 모든 머신에서 일관성을 필요로 하는 워크로드를 실행하는 VM에만 사용해야 합니다.

스냅샷 및 복구 지점

복구 지점은 특정 시점에 생성되는 VM 디스크의 스냅샷에서 생성됩니다. VM을 장애 조치(failover)할 때 복구 지점을 사용하여 대상 위치에서 VM을 복원합니다.

장애 조치(failover)할 때 일반적으로 손상 또는 데이터 손실 없이 VM을 시작하고, VM 데이터가 운영 체제 및 VM에서 실행되는 앱에 대해 일관되는지 확인하려고 합니다. 이는 생성되는 스냅샷의 유형에 따라 달라집니다.

Site Recovery는 다음과 같이 스냅샷을 생성합니다.

  1. Site Recovery는 빈도를 지정하는 경우 기본적으로 데이터의 크래시 일관성이 있는 스냅샷 및 앱 일치 스냅샷을 생성합니다.
  2. 복구 지점은 스냅샷에서 생성되고, 복제 정책에서 보존 설정에 따라 저장됩니다.

일관성

다음 표에서는 여러 유형의 일관성에 대해 설명합니다.

크래시 일관성

설명 세부 정보 권장
크래시 일관성 스냅샷은 스냅샷을 만들 때 디스크에 있는 데이터를 캡처합니다. 메모리의 데이터를 포함하지 않습니다.

VM이 충돌하거나 스냅샷이 생성된 순간 전원 코드를 서버에서 가져온 경우 존재하는 디스크의 데이터에 해당합니다.

크래시 일관성은 운영 체제 또는 VM의 앱에 대한 데이터 일관성을 보장하지 않습니다.
Site Recovery는 기본적으로 5분마다 크래시 일관성 복구 지점을 만듭니다. 이 설정은 수정할 수 없습니다.

오늘날 대부분의 앱은 크래시 일관성 지점에서도 제대로 복구할 수 있습니다.

크래시 일관성 복구 지점은 운영 체제 및 DHCP 서버 및 인쇄 서버와 같은 앱의 복제를 위해 충분합니다.

앱 일치

설명 세부 정보 권장
앱 일치 복구 지점은 앱 일치 스냅샷에서 생성됩니다.

앱 일치 스냅샷은 크래시 일관성 스냅샷의 모든 정보와 메모리의 모든 데이터 및 진행 중인 트랜잭션을 포함합니다.
앱 일치 스냅샷은 VSS(볼륨 섀도 복사본 서비스)를 사용합니다.

1) Azure Site Recovery는 Microsoft SQL의 트랜잭션 로그 백업 시간 및 시퀀스 번호를 변경하지 않는 복사 전용 백업(VSS_BT_COPY) 메서드를 사용합니다.

2) 스냅샷이 시작될 때 VSS는 볼륨에서 복사-쓰기(COW) 작업을 수행합니다.

3) COW를 수행하기 전에 VSS는 머신의 모든 앱에 해당 메모리 상주 데이터를 디스크에 플러시해야 함을 알립니다.

4) 그런 다음, VSS는 백업/재해 복구 앱(이 경우 Site Recovery)에서 스냅샷 데이터를 읽고 진행하도록 허용합니다.
앱 일치 스냅샷은 지정하는 빈도에 따라 생성됩니다. 이 빈도는 항상 복구 지점 유지에 대한 설정보다 작아야 합니다. 예를 들어 24시간의 기본 설정을 사용하여 복구 지점을 보존하는 경우 빈도를 24시간 미만으로 설정해야 합니다.

크래시 일관성 스냅샷보다 더 복잡하며 완료하는 데 시간이 더 걸립니다.

복제에 대해 활성화된 VM에서 실행되는 앱의 성능에 영향을 미칩니다.

복제 프로세스

Azure VM에 대해 복제를 활성화하면 다음 상황이 발생합니다.

  1. Site Recovery 이동성 서비스 확장이 VM에 자동으로 설치됩니다.
  2. 확장은 Site Recovery를 사용하여 VM을 등록합니다.
  3. VM에 대해 연속 복제를 시작합니다. 데이터 쓰기가 원본 위치의 캐시 스토리지 계정에 즉시 전송됩니다.
  4. Site Recovery는 캐시의 데이터를 처리하여 대상 스토리지 계정 또는 복제본 관리 디스크로 보냅니다.
  5. 데이터가 처리된 후 크래시 일관성 복구 지점이 5분마다 생성됩니다. 앱 일치 복구 지점은 복제 정책에 지정된 설정에 따라 생성됩니다.

2단계 복제 프로세스를 보여 주는 다이어그램.

복제 프로세스

연결 요구 사항

복제하는 Azure VM에는 아웃바운드 연결이 필요합니다. Site Recovery에는 VM에 대한 인바운드 연결이 필요하지 않습니다.

아웃바운드 연결(URL)

VM에 대한 아웃바운드 액세스가 URL로 제어되는 경우 다음 URL을 허용합니다.

이름 상업용 정부 설명
스토리지 *.blob.core.windows.net *.blob.core.usgovcloudapi.net VM에서 원본 지역의 캐시 스토리지 계정에 데이터를 쓸 수 있도록 합니다.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Site Recovery 서비스 URL에 대한 권한 부여 및 인증을 제공합니다.
복제 *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us VM이 Site Recovery 서비스와 통신할 수 있도록 합니다.
Service Bus *.servicebus.windows.net *.servicebus.usgovcloudapi.net VM이 Site Recovery 모니터링 및 진단 데이터를 쓸 수 있도록 합니다.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net 포털을 통해 ADE 지원 가상 머신에 대한 복제를 사용하도록 설정하기 위한 액세스를 허용합니다.
Azure Automation *.automation.ext.azure.com *.azure-automation.us 포털을 통해 복제된 항목의 모바일 에이전트의 자동 업그레이드 활성화 허용

IP 주소 범위에 대한 아웃바운드 연결

IP 주소를 사용하여 VM에 대한 아웃바운드 연결을 제어하려면 다음 주소를 허용합니다. 네트워크 연결 요구 사항에 대한 자세한 내용은 네트워킹 백서에서 찾을 수 있습니다.

원본 지역 규칙

규칙 세부 정보 Service 태그
HTTPS 아웃바운드 허용: 포트 443 원본 지역의 스토리지 계정에 해당하는 범위를 허용합니다. Storage.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Microsoft Entra ID에 해당하는 범위 허용 AzureActiveDirectory
HTTPS 아웃바운드 허용: 포트 443 대상 지역의 이벤트 허브에 해당하는 범위를 허용합니다. EventHub.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Azure Site Recovery에 해당하는 범위를 허용합니다. AzureSiteRecovery
HTTPS 아웃바운드 허용: 포트 443 Azure Key Vault에 해당하는 범위를 허용합니다(포털을 통해 ADE 지원 가상 머신의 복제를 사용하도록 설정하는 데만 필요). AzureKeyVault
HTTPS 아웃바운드 허용: 포트 443 Azure Automation 컨트롤러에 해당하는 범위를 허용합니다(포털을 통해 복제된 항목에 대한 모바일 에이전트의 자동 업그레이드를 사용하도록 설정하는 데만 필요). GuestAndHybridManagement

대상 지역 규칙

규칙 세부 정보 Service 태그
HTTPS 아웃바운드 허용: 포트 443 대상 지역의 스토리지 계정에 해당하는 범위를 허용합니다. Storage.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Microsoft Entra ID에 해당하는 범위 허용 AzureActiveDirectory
HTTPS 아웃바운드 허용: 포트 443 원본 지역의 이벤트 허브에 해당하는 범위를 허용합니다. EventHub.<region-name>
HTTPS 아웃바운드 허용: 포트 443 Azure Site Recovery에 해당하는 범위를 허용합니다. AzureSiteRecovery
HTTPS 아웃바운드 허용: 포트 443 Azure Key Vault에 해당하는 범위를 허용합니다(포털을 통해 ADE 지원 가상 머신의 복제를 사용하도록 설정하는 데만 필요). AzureKeyVault
HTTPS 아웃바운드 허용: 포트 443 Azure Automation 컨트롤러에 해당하는 범위를 허용합니다(포털을 통해 복제된 항목에 대한 모바일 에이전트의 자동 업그레이드를 사용하도록 설정하는 데만 필요). GuestAndHybridManagement

네트워크 보안 그룹 규칙을 사용하여 액세스 제어

네트워크 보안 그룹 규칙을 사용하여 Azure 네트워크/서브넷 간 네트워크 트래픽을 필터링하여 VM 연결을 제어하는 경우 다음 요구 사항을 확인하세요.

  • 원본 Azure 지역에 대한 네트워크 보안 그룹 규칙은 복제 트래픽에 대한 아웃바운드 액세스를 허용해야 합니다.
  • 프로덕션 환경에 배치하기 전에 테스트 환경에서 규칙을 만드는 것이 좋습니다.
  • 개별 IP 주소를 허용하는 대신 서비스 태그를 사용합니다.
    • 서비스 태그는 보안 규칙을 만들 때 복잡성을 최소화하도록 함께 수집되는 IP 주소 접두사의 그룹을 나타냅니다.
    • Microsoft는 시간이 지남에 따라 서비스 태그를 자동으로 업데이트합니다.

Site Recovery에 대한 아웃바운드 연결네트워크 보안 그룹을 사용하여 연결 제어에 대해 자세히 알아봅니다.

다중 VM 일관성에 대한 연결

다중 VM 일관성을 사용하도록 설정하면 복제 그룹의 컴퓨터는 20004 포트를 통해 서로 통신하게 됩니다.

  • 20004 포트를 통한 VM 간의 내부 통신을 차단하는 방화벽 어플라이언스가 없는지 확인합니다.
  • Linux VM을 복제 그룹에 포함하고 싶다면 특정 Linux 버전의 지침에 따라 20004 포트의 아웃바운드 트래픽을 수동으로 열어야 합니다.

장애 조치(failover) 프로세스

장애 조치(failover)를 시작하면 대상 리소스 그룹, 대상 가상 네트워크, 대상 서브넷 및 대상 가용성 집합에 VM이 생성됩니다. 장애 조치(failover) 중에는 모든 복구 지점을 사용할 수 있습니다.

원본 및 대상 환경의 장애 조치(failover) 프로세스를 보여 주는 다이어그램.

다음 단계