Azure Stack HCI 확대 클러스터 구현

완료됨

Azure Stack HCI 평가의 일환으로 충분한 고가용성 프로비전을 제공하는 쿼럼 구성을 확인했습니다. 이제 최근에 Contoso의 온-프레미스 데이터 센터에서 발생한 작동 중단에서 드러난 재해 복구 프로비전 부족 문제를 해결하려고 합니다. 이러한 목표를 달성하기 위해 각 사이트의 노드를 사용하여 두 개의 데이터 센터에 걸쳐 Azure Stack HCI 확대 클러스터를 구현하는 가능성을 탐색하기로 결정합니다.

Azure Stack HCI 확대 클러스터 개요

Azure Stack HCI에 대한 사이트 수준 복원력을 제공하기 위해 사이트마다 하나씩 두 개의 노드 그룹으로 구성된 Azure Stack HCI 확대 클러스터를 구현할 수 있습니다. 각 그룹은 두 개 이상의 노드를 포함해야 합니다. 확대 클러스터의 총 노드 수는 Azure Stack HCI가 단일 클러스터에 대해 지원하는 최대 노드 수를 초과할 수 없습니다.

Azure Stack HCI 확대 클러스터는 스토리지 복제본을 사용하여 두 노드 그룹이 해당 물리적 사이트에서 호스트하는 스토리지 볼륨 간에 동기 복제를 수행합니다. 장애가 기본 사이트의 가용성에 영향을 주는 경우 잠재적 가동 중지 시간을 최소화하기 위해 클러스터가 자동으로 정상 사이트의 노드에서 해당 워크로드를 온라인으로 전환합니다. 기본 사이트에서 계획된 가동 중지 시간의 경우 Hyper-V 실시간 마이그레이션을 사용하여 워크로드를 다른 사이트로 전환함으로써 온라인 상태를 유지할 수 있습니다.

참고

동기 복제 요구 사항은 복제된 사이트에서 두 클러스터 노드 그룹 간 왕복 네트워크 대기 시간을 5ms로 제한합니다. 물리적 네트워크 연결 특성에 따라 이 제한은 일반적으로 20~30마일 거리에 해당합니다.

Azure Stack HCI 확대 클러스터는 능동-수동 및 능동-능동 모드를 지원합니다. 능동-수동 모드에서는 재해 복구 기능을 제공하는 다른 사이트에 단방향으로 복제되는 기본 사이트를 지정합니다. 능동-능동 모드에서는 두 사이트가 각각의 볼륨을 양방향으로 서로 복제하여 어느 한 사이트에 장애가 발생하는 경우 장애 조치(failover) 기능을 제공합니다. 능동-능동 모드는 전용 재해 복구 사이트가 필요하지 않으므로 비즈니스 연속성 비용을 최소화하는 데 도움이 됩니다.

Azure Stack HCI 확대 클러스터는 사이트를 인식합니다. 사이트 인식을 사용하면 가상화된 워크로드를 기본 사이트에 할당하여 그 배치를 제어할 수 있습니다. 이러한 방식으로 각 사이트에서 AD DS(Active Directory Domain Services) 도메인 컨트롤러 및 DNS(Domain Name System) 서버와 같은 핵심 인프라 역할을 제공하는 클러스터된 VM을 호스트하도록 할 수 있습니다.

Windows Admin Center를 사용하여 Azure Stack HCI 확대 클러스터 구현

Windows Admin Center의 클러스터 만들기 마법사는 Azure Stack HCI 확대 클러스터를 만드는 과정을 안내하는 마법사 기반 인터페이스를 제공합니다. 이 마법사는 클러스터 노드가 두 개의 고유한 AD DS 사이트에 있는지 또는 해당 IP 주소가 서로 다른 두 서브넷에 속하는지 여부를 감지합니다. 이러한 두 조건 중 하나가 충족되면 마법사에서 해당 클러스터 사이트를 자동으로 만들고 구성합니다. 또한 Windows Admin Center는 복제된 볼륨을 프로비저닝하는 프로세스를 간소화합니다.

참고

확대 클러스터에 대한 볼륨 및 가상 디스크를 만드는 것은 단일 사이트 클러스터보다 복잡합니다. 확대 클러스터에는 각 사이트마다 데이터/로그 볼륨 쌍 하나씩 두 개의 데이터 볼륨과 두 개의 로그 볼륨으로 구성된 최소 4개의 볼륨이 필요합니다. Windows Admin Center를 사용하여 복제된 데이터 볼륨을 만드는 프로세스는 자동으로 기본 사이트에서 로그 볼륨을 프로비전하고 보조 사이트에서 데이터 볼륨 및 복제된 볼륨을 모두 프로비전합니다. 이를 통해 각 볼륨에 필요한 크기와 구성 설정이 유지됩니다.

지식 점검

1.

Contoso를 위해 기본 사이트 내 Azure Stack HCI 클러스터에 대한 재해 복구 기능을 제공하는 재해 복구 사이트를 디자인하고 있습니다. 가상화된 워크로드의 장애 조치(failover)를 자동화하는 확대 클러스터를 구현할 수 있는지 확인해야 합니다. 두 사이트 간의 최대 왕복 네트워크 대기 시간은 얼마여야 하나요?