SAP 워크로드에 대한 재해 복구 개요 및 인프라 지침

Azure에서 중요한 비즈니스 애플리케이션을 실행하는 많은 조직에서는 HA(고가용성) 및 DR(재해 복구) 전략을 모두 설정합니다. 고가용성의 목적은 기본 시스템 인프라에서 단일 실패 지점을 제거하여 비즈니스 시스템의 SLA를 늘리는 것입니다. 고가용성 기술은 계획되지 않은 인프라 오류의 영향을 줄이고 계획된 유지 관리에 도움이 됩니다. 재해 복구는 지리적으로 광범위한 자연 재해 또는 인적 재해가 발생한 후 중요한 기술 인프라 및 시스템의 복구 또는 지속을 가능하게 하는 정책, 도구 및 절차로 정의됩니다.

Azure의 SAP 워크로드에 대한 고가용성을 달성하기 위해 가상 머신은 일반적으로 가용성 집합, 가용성 영역 또는 유연한 확장 집합에 배포되어 지역 내 인프라 유지 관리 또는 실패로부터 애플리케이션을 보호합니다. 그러나 배포는 지역 내에서 광범위한 재해로부터 애플리케이션을 보호하지 않습니다. 따라서 지역 재해로부터 애플리케이션을 보호하려면 애플리케이션에 대한 재해 복구 전략을 마련해야 합니다. 재해 복구는 재해에 대응하여 복구 프로세스를 실행하는 조직을 지원하고 IT 서비스 중단을 보호하거나 최소화하고 복구를 촉진하도록 설계된 문서화되고 구조화된 접근 방식입니다.

이 문서에서는 구조화된 DR 접근 방식을 구현하여 대규모 재해로부터 SAP 워크로드를 보호하는 방법에 대해 자세히 설명합니다. 이 문서의 세부 정보는 다양한 Azure 서비스 및 SAP 구성 요소를 기반으로 추상 수준에서 제공됩니다. SAP 워크로드에 대한 정확한 DR 전략 및 복구 순서는 정기적으로 테스트, 문서화 및 미세 조정되어야 합니다. 또한 이 문서에서는 SAP 워크로드에 대한 Azure-Azure DR 전략에 중점을 둡니다.

일반 재해 복구 계획 고려 사항

Azure의 SAP 워크로드는 다른 Azure 서비스와 함께 가상 머신에서 실행되어 일반적인 SAP NetWeaver 애플리케이션의 다양한 계층(중앙 서비스, 애플리케이션 서버, 데이터베이스 서버)을 배포합니다. 일반적으로 Azure에서 실행되는 전체 IT 환경에 대해 DR 전략을 계획해야 합니다. 즉, 비 SAP 애플리케이션도 고려해야 합니다. 종속 서비스 또는 자산이 DR 사이트에서 복구되지 않은 경우 SAP 시스템에서 실행되는 비즈니스 솔루션이 전체적으로 실행되지 않을 수 있습니다. 따라서 모든 구성 요소와 시스템을 고려하여 잘 정의된 포괄적인 DR 계획을 마련해야 합니다.

Azure의 DR의 경우 조직은 장애 조치(failover)를 트리거할 수 있는 다양한 시나리오를 고려해야 합니다.

  • SAP 애플리케이션 또는 비즈니스 프로세스 가용성.
  • Azure 서비스(예: 가상 머신, 스토리지, 부하 분산 장치 등)는 광범위한 오류로 인해 지역 내에서 사용할 수 없습니다.
  • 애플리케이션에 대한 잠재적 위협 및 취약성(예: 애플리케이션 계층 DDoS 공격)
  • 비즈니스 규정 준수에는 DR 전략을 테스트하기 위한 운영 작업이 필요했습니다(예: 규정 준수에 따라 매년 수행되는 DR 실패 연습).

다양한 시나리오에 대한 복구 목표를 달성하려면 조직은 비즈니스 요구 사항에 따라 워크로드에 대한 RTO(복구 시간 목표) 및 RPO(복구 지점 목표)를 간략하게 설명해야 합니다. RTO는 애플리케이션이 다운될 수 있는 시간(일반적으로 시간, 분 또는 초)을 설명합니다. 반면 RPO는 정상적인 작업이 재개될 수 있도록 비즈니스에서 손실할 수 있는 트랜잭션 데이터의 양을 설명합니다. DR 전략을 최적으로 설계하는 데 도움이 되므로 비즈니스의 RTO 및 RPO를 식별하는 것이 중요합니다. SAP 워크로드와 관련된 구성 요소(컴퓨팅, 스토리지, 데이터베이스 등)는 다양한 기술(Azure 네이티브 서비스, 네이티브 DB 복제 기술, 사용자 지정 스크립트)을 사용하여 DR 지역에 복제됩니다. 각 기술은 DR 전략을 설계할 때 고려해야 하는 다양한 RPO를 제공합니다. Azure에서는 SAP 워크로드의 RTO 및 RPO를 충족하는 데 도움이 되는 Azure Site Recovery, Azure Backup 같은 Azure 원시 서비스 중 일부를 사용할 수 있습니다. RTO 및 RPO에 최적으로 맞추려면 Azure Site RecoveryAzure Backup SLA를 참조하세요.

Azure에서 재해 복구를 위한 설계 고려 사항

Azure에서 재해 복구 솔루션을 설계할 때 고려해야 할 다양한 요소가 있습니다. 온-프레미스 재해 복구 솔루션을 설계하는 것으로 간주되는 원칙과 개념도 Azure에 적용됩니다. 그러나 Azure에서 지역 선택은 재해 복구를 위한 설계 전략의 핵심 부분입니다. 따라서 Azure에서 DR 지역을 선택할 때 다음 사항에 유의하세요.

  • 비즈니스 또는 규정 준수 요구 사항은 기본 및 재해 복구 사이트 간의 거리 요구 사항을 지정할 수 있습니다. 더 넓은 지리적 위치에서 자연 재해가 발생하는 경우 거리 요구 사항은 가용성을 제공하는 데 도움이 됩니다. 이러한 경우 조직은 다른 Azure 지역을 재해 복구 사이트로 선택할 수 있습니다. Azure 지역은 미국 수백 또는 수천 킬로미터에 달하는 먼 거리로 구분되는 경우가 많습니다. 거리 때문에 네트워크 왕복 대기 시간이 더 높아져 RPO가 더 높아질 수 있습니다.

  • Azure에서 온-프레미스 메트로 DR 전략을 모방하려는 고객은 재해 복구를 위해 가용성 영역을 사용할 수 있습니다. 그러나 지리적으로 광범위한 자연 재해가 있는 경우 영역 대 영역 DR 전략은 복원력 요구 사항에 미치지 못할 수 있습니다.

  • Azure에서 각 지역은 동일한 지역(브라질 남부 제외) 내의 다른 지역과 페어링됩니다. 이 방법을 사용하면 지역 전체에서 플랫폼 제공 리소스를 복제할 수 있습니다. 쌍을 이루는 지역을 선택하는 이점은 지역 쌍 문서에서 찾을 수 있습니다. 조직에서 Azure 쌍을 이루는 지역을 사용하도록 선택하는 경우 SAP 워크로드에 대한 몇 가지 추가 지점을 고려해야 합니다.

    • 모든 Azure 서비스가 쌍을 이루는 지역에서 지역 간 복제를 제공하는 것은 아닙니다.

    • 쌍을 이루는 Azure 지역의 Azure 서비스 및 기능은 대칭적이지 않을 수 있습니다. 예를 들어 Azure NetApp Files, 주 지역에서 사용할 수 있는 M 시리즈와 같은 VM SKU는 쌍을 이루는 지역에서 사용할 수 없을 수 있습니다. Azure 제품 또는 서비스를 지역에서 사용할 수 있는지 확인하려면 지역별 Azure 제품을 참조하세요.

    • GRS 옵션은 데이터를 쌍을 이루는 지역에 복제하는 표준 스토리지 형식의 스토리지 계정에 사용할 수 있습니다. 그러나 표준 스토리지는 SAP DBMS 또는 가상 데이터 디스크에 적합하지 않습니다.

    • 지원되는 솔루션을 백업하는 데 사용되는 Azure 백업 서비스는 쌍을 이루는 지역 간에만 백업을 복제할 수 있습니다. 다른 모든 데이터의 경우 SQL Server Always On, SAP HANA 시스템 복제, 기타 서비스와 같은 원시 DBMS 기능을 사용하여 사용자 고유의 복제를 수행합니다. SAP 애플리케이션 계층에 Azure Site Recovery, rsync 또는 robocopy 및 기타 타사 소프트웨어의 조합을 사용합니다.

참조 SAP 워크로드 배포

DR 지역을 식별한 후에는 주 지역에서 구성한 Azure 핵심 서비스(예: 네트워크, 컴퓨팅, 스토리지)를 사용할 수 있고 DR 지역에서 구성할 수 있어야 합니다. 조직은 SAP 워크로드에 대한 DR 배포 패턴을 개발해야 합니다. 배포 패턴은 다양하며 조직의 요구 사항에 맞춰야 합니다.

  • 주 지역에 프로덕션 SAP 워크로드를 배포하고 비프로덕션 워크로드를 재해 복구 지역에 배포합니다.
  • 모든 SAP 워크로드(프로덕션 및 비프로덕션)를 주 지역에 배포합니다. 재해 복구 지역은 장애 조치(failover)가 있는 경우에만 사용됩니다.

다음 참조 아키텍처는 주 지역의 고가용성과 함께 Azure에서 실행되는 일반적인 SAP NetWeaver 시스템을 보여줍니다. 아래에 표시된 보조 사이트는 재해 이벤트 후 SAP 시스템이 복원되는 재해 복구 사이트입니다. 주 지역 및 재해 복구 지역 모두 동일한 구독의 일부입니다. SAP 워크로드용 DR을 달성하려면 애플리케이션에서 사용하는 다양한 Azure 서비스와 함께 각 SAP 계층에 대한 복구 전략을 식별해야 합니다.

조직은 전체 IT 환경에 대한 DR 전략을 계획하고 설계해야 합니다. 일반적으로 프로덕션 환경에서 실행되는 SAP 시스템은 Active Directory, DNS, 타사 애플리케이션 등과 같은 다양한 서비스 및 인터페이스와 통합됩니다. 따라서 재해 복구 계획에 비 SAP 시스템 및 기타 서비스도 포함해야 합니다. 이 문서에서는 SAP 애플리케이션에 대한 복구 계획에 중점을 둡니다. 그러나 요구 사항에 맞게 종속 구성 요소에 대한 DR 계획의 크기 및 범위를 확장할 수 있습니다.

Disaster Recovery reference architecture for SAP workload

SAP 워크로드용 DR 솔루션의 인프라 구성 요소

Azure에서 실행되는 SAP 워크로드는 다양한 인프라 구성 요소를 사용하여 비즈니스 솔루션을 실행합니다. 이러한 솔루션에 대해 DR을 계획하려면 주 지역에 구성된 모든 인프라 구성 요소를 사용할 수 있고 DR 지역에서도 구성할 수 있어야 합니다. Azure에서 SAP 워크로드용 DR 솔루션을 설계할 때 다음 인프라 구성 요소를 고려해야 합니다.

  • 네트워크
  • 컴퓨팅
  • 스토리지

네트워크

  • ExpressRoute는 연결 공급자의 도움을 받아 프라이빗 연결을 통해 온-프레미스 네트워크를 Microsoft 클라우드로 확장합니다. 재해 복구 아키텍처를 설계할 때 지역 중복 ExpressRoute 회로를 사용하여 강력한 백 엔드 네트워크 연결을 빌드해야 합니다. 온-프레미스에서 주 지역으로 하나 이상의 ExpressRoute 회로를 설정하는 것이 좋습니다. 다른 하나는 재해 복구 지역에 연결해야 합니다. ExpressRoute에 대한 재해 복구를 설계하는 다양한 시나리오를 설명하는 재해 복구를 위한 Azure ExpressRoute 설계 문서를 참조하세요.

    참고 항목

    S2S(사이트 간) VPN을 Azure ExpressRoute의 백업으로 설정하는 것이 좋습니다. 자세한 내용은 Azure ExpressRoute 개인 피어링에 대한 백업으로 S2S VPN 사용을 참조하세요.

  • 가상 네트워크와 서브넷은 지역의 모든 가용성 영역에 걸쳐 있습니다. 두 지역의 DR의 경우 재해 복구 지역에서 별도의 가상 네트워크와 서브넷을 구성해야 합니다. DR 지역의 네트워킹 설정에 대한 자세한 내용은 Azure VM 재해 복구의 네트워킹 정보를 참조하세요.

  • Azure 표준 Load Balancer는 SAP 시스템의 고가용성 설계를 위한 네트워킹 요소를 제공합니다. 클러스터형 시스템의 경우 표준 Load Balancer는 VM에서 실행되는 ASCS/SCS 인스턴스 및 데이터베이스와 같은 클러스터 서비스의 가상 IP 주소를 제공합니다. DR 사이트에서 고가용성 SAP 시스템을 실행하려면 별도의 부하 분산 장치를 만들어야 하며 그에 따라 클러스터 구성을 조정해야 합니다.

  • Azure Application Gateway는 웹 트래픽 부하 분산 장치입니다. Web Application Firewall 기능을 사용하여 향상된 보안으로 웹 애플리케이션을 인터넷에 노출시키는 이상적인 서비스입니다. Azure Application Gateway는 구성에 따라 퍼블릭(인터넷)이나 프라이빗 클라이언트 또는 둘 모두에 서비스할 수 있습니다. 장애 조치(failover) 후 DR 지역에서 유사한 들어오는 HTTP 트래픽을 허용하려면 DR 지역에 별도의 Azure Application Gateway를 구성해야 합니다.

  • DR 지역에서 네트워킹 구성 요소(예: 가상 네트워크, 방화벽 등)가 별도로 생성되므로 DR 지역의 SAP 워크로드가 DNS 업데이트, 방화벽 등과 같은 네트워킹 변경 내용에 맞게 조정되었는지 확인해야 합니다.

  • 두 지역의 가상 네트워크는 독립적이며 둘 간의 통신을 설정하려면 두 지역 간에 가상 네트워크 피어링을 사용하도록 설정해야 합니다.

가상 머신

  • Azure에서는 단일 SAP 시스템의 여러 구성 요소가 서로 다른 SKU 형식의 가상 머신에서 실행됩니다. DR의 경우 Azure VM에서 실행되는 애플리케이션(SAP NetWeaver 및 비 SAP)의 보호는 Azure Site Recovery를 사용하여 구성 요소를 다른 Azure 지역 또는 영역으로 복제하여 사용하도록 설정할 수 있습니다. Azure Site Recovery를 사용하면 Azure VM이 기본 사이트에서 재해 복구 사이트로 지속적으로 복제됩니다. 선택한 Azure DR 지역에 따라 DR 사이트에서 VM SKU 유형을 사용할 수 없을 수 있습니다. 필요한 VM SKU 형식도 Azure DRregion에서 사용할 수 있는지 확인해야 합니다. 지역별 Azure 제품을 확인하여 필요한 VM 제품군 SKU 유형을 사용할 수 있는지 확인합니다.

    Important

    SAP 시스템이 FD=1로 유연한 확장 집합으로 구성된 경우 PowerShell을 사용하여 재해 복구를 위한 Azure Site Recovery를 설정해야 합니다. 현재 확장 집합에 배포된 VM에 대한 재해 복구를 구성하는 데 사용할 수 있는 유일한 방법입니다.

  • Azure 가상 머신에서 실행되는 데이터베이스의 경우 원시 데이터베이스 복제 기술을 사용하여 데이터를 재해 복구 사이트와 동기화하는 것이 좋습니다. 데이터베이스가 실행 중인 대형 VM은 모든 지역에서 사용할 수 없습니다. 재해 복구에 가용성 영역을 사용하는 경우 재해 복구 사이트의 영역에서 해당 VM SKU를 사용할 수 있는지 검사 합니다.

    참고 항목

    DB 일관성을 보장하지 않고 데이터 변동 제한이 있으므로 데이터베이스에 Azure Site Recovery를 사용하는 것은 권장되지 않습니다.

  • 프로덕션 애플리케이션이 항상 주 지역에서 실행되기 때문에 예약 인스턴스는 일반적으로 Azure 비용을 절약하기 위해 사용됩니다. 예약 인스턴스를 사용하는 경우 DR 사이트에 비용이 효율적이지 않을 수 있는 1년 또는 3년 약정에 등록해야 합니다. 또한 Azure Site Recovery를 설정해도 장애 조치(failover) 중에 필요한 VM SKU의 용량이 보장되지는 않습니다. VM SKU 용량을 사용할 수 있도록 하려면 주문형 용량 예약을 사용하도록 설정하는 옵션을 고려할 수 있습니다. 약정 없이 일정 기간 동안 Azure 지역 또는 Azure 가용성 영역에서 컴퓨팅 용량을 예약합니다. Azure Site Recovery는 주문형 용량 예약과 통합됩니다. 이 통합을 통해 Azure Site Recovery와 함께 용량 예약의 기능을 사용하여 DR 사이트에서 컴퓨팅 용량을 예약하고 장애 조치(failover)를 보장할 수 있습니다. 자세한 내용은 주문형 용량 예약 제한 사항 및 제한을 참조하세요.

  • Azure 구독에는 VM 제품군(예: Mv2 제품군) 및 기타 리소스에 대한 할당량이 있습니다. 조직에서 DR에 다른 Azure 구독을 사용하려는 경우가 있습니다. 각 구독(기본 및 DR)에는 각 VM 제품군에 대해 할당된 할당량이 다를 수 있습니다. DR 사이트에 사용되는 구독에 사용 가능한 컴퓨팅 할당량이 충분한지 확인합니다.

스토리지

  • VM에 대한 Azure Site Recovery에서 DR을 설정할 수 있도록 설정하면 VM에 연결된 OS 및 로컬 데이터 디스크가 DR 사이트에 복제됩니다. 복제하는 동안 VM 디스크 쓰기는 원본 지역의 캐시 스토리지 계정으로 전송됩니다. 여기에서 대상 지역으로 데이터가 전송되고 데이터에서 복구 지점이 생성됩니다. DR 중에 VM을 장애 조치(failover)하면 복구 지점이 대상 지역에서 VM을 복원하는 데 사용됩니다. 그러나 Azure Site Recovery는 Azure에서 사용할 수 있는 모든 스토리지 유형을 지원하지는 않습니다. 자세한 내용은 스토리지에 대한 Azure Site Recovery 지원 매트릭스를 참조하세요.

  • VM에 연결된 Azure 관리형 데이터 디스크 외에도 Azure에서 SAP 애플리케이션을 실행하는 데 다양한 Azure 원시 스토리지 솔루션이 사용됩니다. Azure에서 사용할 수 있는 모든 스토리지 서비스가 Azure Site Recovery를 지원하는 것은 아니므로 각 Azure 스토리지 솔루션에 대한 DR 접근 방식이 다를 수 있습니다. 다음은 일반적으로 SAP 워크로드에 사용되는 스토리지 유형의 목록입니다.

    스토리지 유형 DR 전략 권장 사항
    Managed Disk Azure Site Recovery
    Azure 파일의 NFS(LRS 또는 ZRS) 두 사이트 간에 데이터를 복제하는 사용자 지정 스크립트(예: rsync)
    Azure NetApp Files의 NFS Azure NetApp Files 볼륨의 지역 간 복제 사용
    Azure 공유 디스크(LRS 또는 ZRS) 두 사이트 간에 데이터를 복제하는 사용자 지정 솔루션
    Azure 파일의 SMB(LRS 또는 ZRS) RoboCopy를 사용하여 두 사이트 간에 파일 복사
    Azure NetApp Files의 SMB Azure NetApp Files 볼륨의 지역 간 복제 사용
  • NFS 클러스터와 같은 사용자 지정 빌드 스토리지 솔루션의 경우 적절한 DR 전략이 있는지 확인해야 합니다.

  • 다른 원시 Azure 스토리지 서비스(예: Azure Files, Azure NetApp Files, Azure 공유 디스크)는 모든 지역에서 사용할 수 없습니다. 따라서 장애 조치(failover) 후 DR 지역에 유사한 SAP를 설정하려면 DR 사이트에서 해당 스토리지 서비스가 제공되는지 확인합니다. 자세한 내용은 지역별 Azure 제품을 확인하세요.

  • 재해 복구에 가용성 영역을 사용하는 경우 다음 사항에 유의하세요.

    • Azure NetApp Files 기능은 아직 영역을 인식하지 않습니다. 현재 Azure NetApp Files 기능은 Azure 지역의 모든 가용성 영역에 배포되지 않습니다. 따라서 DR 전략에 대해 선택한 가용성 영역에서 Azure NetApp Files 서비스를 사용할 수 없는 경우가 발생할 수 있습니다.
    • Azure NetApp 파일 볼륨의 지역 간 복제는 영역 간이 아닌 고정 지역 쌍에서만 사용할 수 있습니다.
  • Active Directory 통합을 사용하여 스토리지를 구성한 경우 DR 사이트 스토리지 계정에서도 유사한 설정을 수행해야 합니다.

  • Azure 공유 디스크에는 클러스터 노드 통신 및 쓰기 잠금을 처리하는 WSFC(Windows Server 장애 조치(Failover) 클러스터)와 같은 클러스터 소프트웨어가 필요합니다. 따라서 Azure 공유 디스크에 대한 DR 전략을 사용하려면 DR 사이트에서 클러스터 소프트웨어로 관리되는 공유 디스크도 있어야 합니다. 그런 다음 스크립트를 사용하여 주 지역의 클러스터에 연결된 공유 디스크에서 DR 지역의 다른 클러스터에 연결된 공유 디스크로 데이터를 복사할 수 있습니다.

다음 단계