Azure Site Recovery 설명하기

완료됨

Contoso는 계획되거나 계획되지 않은 중단이 발생하는 경우에도 데이터를 안전하게 보존하고 앱과 워크로드를 온라인 상태로 유지할 수 있는 비즈니스 연속성 및 재해 복구 전략을 도입해야 합니다. Contoso는 Azure Site Recovery을 사용해서 중단이 발생했을 때에도 비즈니스 앱과 워크로드를 지속적으로 실행해 비즈니스 연속성을 보장할 수 있습니다.

Azure Site Recovery는 실제 서버와 VM에서 실행되는 워크로드를 기본 사이트에서 보조 위치로 복제합니다. Contoso 기본 사이트에서 중단이 발생하면 워크로드를 보조 위치로 장애 조치(failover)하여 사용자가 해당 위치에서 앱에 액세스할 수 있습니다. 기본 사이트가 재실행되면 관리자가 워크로드를 기본 사이트로 장애 복구(Failback)할 수 있습니다.

Azure Site Recovery는 다음과 같은 목적을 위해 복제를 관리할 수 있습니다.

  • Azure 지역 간에 Azure VM 복제
  • 온-프레미스 VM, Azure Stack VM 및 실제 서버.

Azure Site Recovery란?

Azure Site Recovery를 사용해서 Azure 지역 간에 VM을 복제할 수 있습니다. 또한 Azure Site Recovery를 사용해 온-프레미스 인프라에서 Azure로 온-프레미스 VM과 실제 서버를 마이그레이션할 수 있습니다. Contoso 뉴욕 지사에서 폭우로 인해 중단이 발생했다고 가정해봅시다. 이러한 중단을 해결하기 위해 Azure로 장애 조치(failover)를 수행해서 Azure Site Recovery를 사용할 수 있습니다.

Azure Site Recovery의 사이트 복구 기능 덕분에 향후 중단을 관리할 수 있습니다. Azure Site Recovery는 지정된 기본 사이트 또는 지역에서 선택한 보조 사이트 또는 지역으로 워크로드를 복제할 수 있도록 설계되었습니다. 다음 그래픽에서 주 지역은 미국 동부이며 보조 지역은 미국 중부입니다.

A diagram depicts a site outage in the East US region with failover to a site in the Central US region.

Azure Site Recovery는 다음과 같은 복제를 관리합니다.

  • 지역 간 Azure VM 복제.
  • 온-프레미스 VM와 Azure 간 복제.

Azure Site Recovery는 Azure의 기본 제공 구성 요소이므로 프로덕션 워크로드에 지장을 주지 않고 재해 복구 훈련으로 알려진 테스트를 원활하게 실행할 수 있습니다. 이는 재해 복구 계획이 필요한 경우 그 효과를 확인할 수 있다는 의미이기도 합니다.

Azure Site Recovery는 다음 표에 설명된 기능을 제공합니다.

기능 설명
Azure 가상 머신 보호 Azure Site Recovery를 통해 Azure에서 VM을 자동으로 보호할 수 있습니다. Azure Site Recovery는 소스 VM 구성을 미러링하며 보조 Azure 지역에 대한 필수 또는 관련 리소스 그룹, 스토리지 계정, 가상 네트워크 및 가용성 집합을 만듭니다. Azure Site Recovery가 만드는 리소스에는 Azure Site Recovery 접미사가 추가됩니다.
스냅샷 및 복구 지점 Azure Site Recovery에는 사용자 지정 가능한 복제 정책이 존재합니다. 이러한 정책으로 복구 지점의 보존 기록과 스냅샷 빈도를 파악할 수 있습니다. VM 디스크의 스냅샷에서 복구 지점을 만듭니다. 사용 가능한 스냅샷에는 두 가지 형식이 있습니다. 충돌 일치 및 앱 일치입니다. 충돌 일치 복구는 스냅샷이 생성될 때 디스크에 있는 데이터를 나타냅니다. 앱 일치 복구는 충돌 일치와 동일한 데이터를 캡처하지만, 이는 메모리 내 데이터와 처리되는 트랜잭션을 전부 포함하고 있습니다. 메모리 내 데이터가 포함되기 때문에 Azure Site Recovery는 데이터 손실 없이 VM 및 실행 중인 모든 앱을 복원할 수 있습니다. 모든 복구 지점은 기본적으로 24시간 동안 유지되며, 해당 기간을 72시간까지 연장할 수 있습니다.
보조 지역으로 복제 Azure VM 복제를 사용하도록 설정하면 Azure Site Recovery 모바일 서비스가 설치됩니다. 이 확장으로 Azure Site Recovery를 사용해 VM을 등록합니다. 그러면 VM 연속 복제가 시작되며 디스크에 대한 모든 쓰기가 즉시 로컬 스토리지 계정에 전송됩니다. Azure Site Recovery는 이 계정을 사용하여 대상 환경의 스토리지 계정에 캐시를 복제합니다. Azure Site Recovery는 캐시에 저장된 데이터를 복사하고 대상 스토리지 계정 또는 복제된 관리 디스크와 동기화합니다. 데이터가 처리된 후 충돌 일치 복구 지점이 생성됩니다. 앱 일치 복구 지점이 사용 설정되면, Azure Site Recovery 복제 정책에 설정된 일정에 따라 생성되게 됩니다.
DR(재해 복구) 훈련 Azure Site Recovery를 사용하면 사전에 필요한 구성 작업이 모두 완료된 후 재해 복구 훈련을 수행할 수 있습니다. 훈련을 실행하면 데이터 손실, 가동 중지 시간 또는 프로덕션 환경 손상 없이 사용자 환경에 대한 복제 전략의 유효성을 검사할 수 있습니다.
유연한 장애 조치 및 장애 복구 Azure Portal을 사용해 Azure Site Recovery 장애 조치(failover) 및 장애 복구(failback)를 빠르게 시작할 수 있습니다. 장애 조치(failover)를 실행할 때 복구 지점을 선택하면 Azure Site Recovery를 통해 장애 조치를 관리할 수 있습니다. 장애 복구는 이 프로세스의 역순 작업입니다. 장애 조치가 커밋되면 장애 복구를 사용할 수 있습니다.

Azure Site Recovery를 사용하여 장애 조치 및 장애 복구

조직은 Azure Site Recovery를 사용하여 보조 Azure 지역 대상으로 수동 장애 조치(failover)를 실행하는 유연성을 발휘하거나 원본 VM으로 변경할 수 있습니다. 이 프로세스를 관리하는 가장 간단한 방법은 Azure Portal에서 수동으로 관리하는 것입니다.

장애 조치(failover)는 조직의 재해 복구 계획을 실행하는 결정을 내릴 때 발생합니다. Azure Site Recovery로 보호되는 기존 프로덕션 환경은 다른 지역으로 전환됩니다. 대상 환경은 프로덕션 환경이 되어 조직의 프로덕션 서비스 실행 환경이 됩니다.

참고

대상 지역이 활성화된 후에는 더 이상 원본 환경을 사용하지 않아야 합니다. 원본 VM을 중지 상태로 두면 적용됩니다.

원본 VM을 종료하는 또 다른 이점이 있습니다. 종료 VM을 사용하면 장애 조치(failover)를 트리거하기 전에 모든 데이터가 디스크에 기록될 때까지 Azure Site Recovery가 대기하므로 데이터 손실이 최소화됩니다.

다시 보호란 무엇이며 왜 중요한가요?

VM을 장애 조치(failover)하면 Azure Site Recovery에서 수행한 복제가 더 이상 발생하지 않습니다. 그 대신 장애 조치한 VM 보호를 시작하려면 보호를 다시 사용 설정해야 합니다. 이미 다른 지역에 인프라가 있으므로 다시 원본 지역에 대한 복제를 시작할 수 있습니다. 다시 보호를 사용하면 Azure Site Recovery가 복제가 시작된 원본 환경으로 다시 새 대상 환경을 복제하기 시작할 수 있습니다.

단일 VM을 장애 조치(failover)하거나 복구 계획을 사용하여 장애 조치하는 유연성을 사용하여 장애 조치된 인프라를 다시 보호할 수 있습니다. 각 VM을 개별적으로 다시 보호하거나 복구 계획을 사용하여 여러 VM을 다시 보호할 수 있습니다.

참고

VM 크기 및 형식에 따라 다시 보호하는 데 2시간 정도 소요됩니다. 진행률 모니터링을 통해 모니터링할 수 있는 그 외 Site Recovery 프로세스와는 달리, 반드시 VM 수준에서 재보호를 모니터링해야 합니다.

장애 복구란?

장애 복구는 장애 조치의 역순 작업입니다. 보조 지역에 대한 완료된 장애 조치(failover)가 커밋되고 현재 프로덕션 환경이 된 경우입니다. 장애 조치된 환경에 대한 다시 보호가 완료되었고 이제는 원본 환경이 복제본입니다.

참고

장애 복구 시나리오에서 Azure Site Recovery는 다시 원본 VM으로 장애 조치됩니다.

장애 조치(Failover) 유형

Site Recovery는 다른 장애 조치(failover) 옵션을 제공합니다.

  • 장애 조치(failover)를 테스트합니다. 데이터 손실 또는 가동 중지 시간 없이 BCDR 전략 유효성 검사 훈련을 실행하려면 이 옵션을 사용합니다. 이 옵션은 진행 중인 복제 또는 프로덕션 환경에 영향을 주지 않고 Azure에서 VM 복사본을 만듭니다. BCDR 전략을 검증하려면 다음을 수행하세요.
    1. 복구 계획의 단일 VM 또는 여러 VM에서 장애 조치(failover) 테스트를 실행합니다.
    2. 장애 조치(failover) 테스트에 사용할 복구 지점을 선택합니다.
    3. 장애 조치(failover) 이후 생성되는 Azure VM이 위치하게 될 Azure 네트워크를 선택합니다. 네트워크는 장애 조치(failover) 테스트에서만 사용됩니다.
    4. 장애 조치(failover) 테스트가 예상 대로 작동하는지 확인합니다. 테스트 이후 Site Recovery에서 Azure에서 훈련이 진행되는 동안 만들었던 VM을 자동 정리합니다.
  • 계획된 장애 조치(failover)-Hyper-V. 일반적으로 계획된 장애 조치(failover) Hyper-V 전략에서 계획된 유지 관리에 사용되는 원본 VM이 종료되며 장애 조치를 시작하기 전에 최신 데이터가 동기화됩니다. 계획된 장애 조치(failover)으로 인해 가동 중지 시간이 어느 정도 발생하지만 데이터는 손실되지 않습니다.
    1. 가동 중지 시간 유지 관리 기간을 계획하고 사용자에게 안내합니다.
    2. 사용자 지향 앱을 오프라인으로 전환합니다.
    3. 최신 복구 지점을 사용하여 계획된 장애 조치(failover)를 시작합니다. (머신이 종료되지 않거나 오류가 발생한 경우, 장애 조치(failover)가 실행되지 않습니다.)
    4. 장애 조치(failover) 이후, Azure에서 복제본 Azure VM이 활성 상태인지 확인합니다.
    5. 장애 조치(failover)를 커밋하여 완료합니다. 커밋 작업으로 사용 가능한 모든 복구 지점이 삭제됩니다.
  • 장애 조치(failover)-Hyper-V. 이 장애 조치(failover) 옵션은 보통 계획되지 않은 중단이 발생하거나 기본 사이트 사용이 불가능할 경우 실행하게 됩니다. 필요에 따라 장애 조치(failover)를 시작하기 전에 VM을 종료하고 최종 변경 내용을 동기화할 수 있습니다. 이 메서드는 앱 데이터 손실을 최소화합니다.
    1. BCDR 계획을 시작합니다.
    2. 장애 조치를 시작합니다. 장애 조치(failover)를 트리거하기 전에 Site Recovery는 VM을 종료하고 최신 변경 내용의 동기화/복제 여부를 지정해야 합니다.
    3. 다양한 복구 지점 옵션에서 장애 조치(failover)를 수행할 수 있습니다.
      • VM 종료 옵션을 사용 설정하지 않거나 또는 Site Recovery 종료가 불가능할 경우 최신 복구 지점이 사용됩니다.
      • 장애 조치(failover)는 머신을 종료할 수 없을 때에도 실행됩니다.
    4. 장애 조치(failover) 이후, Azure에서 복제본 Azure VM이 활성 상태인지 확인합니다. 필요한 경우, 24시간 동안 보존 기간에서 다른 복구 지점을 선택할 수 있습니다.
    5. 장애 조치(failover)를 커밋하여 완료합니다. 커밋 작업으로 사용 가능한 모든 복구 지점이 삭제됩니다.
  • 장애 조치(failover)-VMware. 이 장애 조치(failover) 옵션은 보통 계획되지 않은 중단이 발생하거나 기본 사이트 사용이 불가능할 경우 실행하게 됩니다. 필요에 따라 Site Recovery가 VM 종료를 트리거하고, 장애 조치(failover)가 시작되기 전에 최종 변경 내용을 동기화하고 복제하도록 지정할 수 있습니다. 이 메서드를 사용하면 앱 데이터 손실을 최소화할 수 있습니다.
    1. BCDR 계획을 시작합니다.
    2. Site Recovery에서 장애 조치(failover)를 시작합니다.
      • 장애 조치(failover)를 실행하기 전에 Site Recovery의 VM 종료 및 동기화 시도 여부를 지정합니다. (장애 조치(failover)는 머신을 종료할 수 없을 때에도 실행됩니다.)
    3. 장애 조치(failover) 이후, Azure에서 복제본 Azure VM이 활성 상태인지 확인합니다.
      • 필요한 경우, 72 시간 동안 보존 기간에서 다른 복구 지점을 선택할 수 있습니다.
    4. 장애 조치(failover)를 커밋하여 완료합니다. 커밋 작업으로 모든 복구 지점이 삭제됩니다. Windows VM의 경우 Site Recovery는 장애 조치(failover) 중에 VMware 도구를 사용하지 않도록 설정합니다.