Windows Server 장애 조치(failover) 클러스터링 정의

완료됨

Contoso를 비롯한 대부분의 조직 및 기업은 중요 업무용 워크로드의 고가용성을 보장하기 위해 노력하고 있습니다. Contoso는 Windows Server 장애 조치(failover) 클러스터링을 사용하는 것을 고려할 수 있습니다. 파일 공유, VM(가상 머신), 데이터베이스 관리 시스템 및 메시징 서비스를 비롯한 일반적인 Windows 기반 워크로드의 고가용성을 제공하는 Windows Server 기능입니다.

장애 조치(failover) 클러스터링 개요

워크로드의 고가용성을 달성하기 위해 여러 Windows Server 컴퓨터로 구성된 장애 조치(failover) 클러스터를 만듭니다. 장애 조치(failover) 클러스터의 일부인 서버가 실패하거나 사용할 수 없게 되면 동일한 장애 조치(failover) 클러스터의 다른 서버가 실패한 노드가 제공한 서비스를 대신합니다. 이를 장애 조치(failover )라고 하며 서비스에 액세스하는 클라이언트에 대한 서비스 중단을 최소화합니다.

장애 조치(failover) 클러스터링의 가장 일반적인 용도는 다음과 같습니다.

  • Microsoft SQL Server 데이터베이스 및 Microsoft Hyper-V VMS의 구성 및 디스크 파일을 호스트하는 고가용성 또는 지속적으로 사용 가능한 파일 공유입니다.
  • 물리적 서버 또는 클러스터형 Hyper-V 서버에서 호스트되는 게스트 VM에서 실행되는 고가용성 서비스 및 애플리케이션

장애 조치(failover) 클러스터링 구성 요소

장애 조치(failover) 클러스터는 다음 표에 설명된 구성 요소로 구성됩니다.

구성 요소 설명
Nodes 장애 조치(failover) 클러스터의 구성원인 Windows Server 컴퓨터 이러한 컴퓨터에는 Windows Server 장애 조치(failover) 클러스터링 기능이 설치되어 있으며 서비스, 애플리케이션 및 리소스로 구성된 고가용성 워크로드를 실행합니다.
클라이언트 고가용성 서비스 및 애플리케이션을 사용하는 컴퓨터는 장애 조치(failover) 클러스터에서 실행됩니다. 클라이언트와 클러스터 간에 여러 네트워크 경로가 있어야 합니다.
네트워크 클러스터된 워크로드를 사용하는 노드와 컴퓨터 간의 통신을 사용하도록 설정합니다. 또한 노드는 공유 스토리지에 자주 액세스합니다.
클러스터된 역할 클러스터 노드에서 실행되는 고가용성 역할 또는 서비스입니다. 클라이언트는 클러스터 노드에 연결하여 이 서비스를 사용합니다. 이러한 서비스를 한 노드에서 사용할 수 없게 되면 장애 조치(failover) 클러스터가 자동으로 다른 노드로 장애 조치(failover)됩니다.
리소스 장애 조치(failover) 클러스터가 관리하는 공유 폴더, 디스크 또는 IP 주소와 같은 물리적 또는 논리적 요소입니다. 리소스는 클라이언트에 서비스를 제공하거나 고가용성 애플리케이션의 필수적인 부분일 수 있습니다. 리소스는 특정 시점에 단일 노드에서만 실행될 수 있습니다.
클러스터 스토리지 Windows Server OS가 설치된 자체 로컬 스토리지 외에도 각 클러스터 노드는 애플리케이션 구성 및 데이터가 상주하는 고가용성 공유 스토리지에 액세스할 수 있습니다. 예를 들어 클러스터 스토리지 는 고가용성 게스트 VM의 구성 데이터 및 가상 하드 디스크를 호스트합니다.

두 개의 노드와 공유 스토리지가 있는 장애 조치(failover) 클러스터의 아키텍처를 보여 줍니다.

비고

공유 스토리지는 여러 노드에 직접 연결할 필요가 없습니다. Windows Server 2016에 도입된 스토리지 공간 다이렉트 기술을 사용하면 개별 노드에 연결된 디스크를 공유할 수 있습니다.

장애 조치(failover) 클러스터링 기능 수준

Windows Server 장애 조치(failover) 클러스터링 기능은 클러스터의 기능 수준에 따라 달라집니다. 일반적으로 클러스터에서 가능한 가장 높은 기능 수준을 사용하는지 확인하려고 합니다. 그러나 Windows Server 2016 및 Windows Server 2025에서 낮은 기능 수준을 지원하면 이전 OS 버전을 실행하는 장애 조치(failover) 클러스터의 롤링 업그레이드를 수행할 수 있습니다. 이렇게 하면 업그레이드하는 동안 Windows Server 2016 및 Windows Server 2025 노드가 동일한 장애 조치(failover) 클러스터에 있을 수 있으므로 가동 중지 시간이 필요하지 않습니다.

팁 (조언)

Windows Server 2016을 실행하는 모든 노드가 Windows Server 2025 노드로 대체된 후에는 클러스터 기능 수준을 업데이트할 수 있습니다.

장애 조치(failover) 클러스터링 쿼럼

장애 조치(failover) 클러스터에서 용어 쿼럼 은 해당 클러스터가 온라인 상태를 유지하는 데 사용할 수 있어야 하는 클러스터링 구성 요소의 수를 나타냅니다. 이러한 구성 요소에는 클러스터 노드 및 선택적으로 미러링 모니터가 포함될 수 있습니다. 미러링 모니터란 쿼럼을 설정하고 유지 관리하는 역할을 갖는 리소스를 말합니다. 이를 위해 장애 조치(failover) 클러스터는 다음을 사용할 수 있습니다.

  • 파일 공유
  • 디스크
  • Azure Storage의 Blob

쿼럼은 클러스터 노드 및 감시와 연결된 투표 수에 따라 결정됩니다. 쿼럼의 목적은 "분할 브레인" 시나리오를 방지하는 것입니다. 이 시나리오에서는 노드 간 연결 문제로 인해 클러스터의 두 노드 집합이 서로 독립적으로 작동하기 시작하여 클러스터 상태와 해당 리소스가 손상될 수 있습니다.

쿼럼 모델은 투표 할당을 정의합니다. Windows Server 장애 조치(failover) 클러스터링에서는 동적 쿼럼 관리를 제공합니다. 이렇게 하면 사용 가능한 클러스터 노드를 기반으로 쿼럼 모델을 지속적으로 모니터링하고 조정하여 장애 조치(failover) 클러스터 내에서 더 높은 가용성을 제공합니다.

클러스터 쿼럼 계산은 노드 수가 변경될 때 조정됩니다. 장애 조치(failover) 클러스터에 원래 노드 수의 50% 미만이 있더라도 장애 조치(failover) 클러스터는 계속 작동하며 클러스터 역할을 계속 사용할 수 있습니다. 동적 쿼럼을 사용하는 경우 하나의 노드만 실행 중이면 장애 조치(failover) 클러스터가 유지될 수 있습니다.

비고

동적 쿼럼 모델은 기본적으로 사용하도록 설정되어 있습니다.

장애 조치(failover) 클러스터링에서는 다음과 같은 쿼럼 관련 기능도 지원합니다.

  • 노드 가중치입니다. Windows Server는 장애 조치(failover) 노드가 여러 물리적 위치에 있는 환경에서 주로 클러스터 노드 가중치를 사용합니다. 이러한 환경에서는 보조 위치의 여러 노드를 사용할 수 없게 되더라도 장애 조치(failover) 클러스터가 기본 위치에서 중단 없이 계속 실행되도록 할 수 있습니다. 이를 위해 보조 위치의 장애 조치(failover) 클러스터 노드에 노드 가중치를 0으로 할당하여 쿼럼 상태에 미치는 영향을 효과적으로 제거할 수 있습니다.
  • 동적 감시. 기본적으로 Windows Server는 장애 조치(failover) 클러스터의 투표 노드 수에 따라 미러링 모니터 서버 투표를 동적으로 조정합니다. 장애 조치(failover) 클러스터에 홀수의 투표가 있는 경우 쿼럼 감시에는 투표가 없습니다. 장애 조치(failover) 클러스터의 투표 수가 짝수이면 쿼럼 감시에 투표가 있습니다. 또한 쿼럼 감시 투표는 감시 리소스의 상태에 따라 동적으로 조정됩니다. 미러니스트 리소스가 오프라인 상태이거나 실패한 경우 미러니스트는 투표를 하지 않습니다.
  • 50% 노드 분할에 대한 연결 차단기입니다. 장애 조치(failover) 클러스터는 노드의 투표를 동적으로 조정하여 홀수의 총 투표를 유지할 수 있습니다. 이를 위해 장애 조치(failover) 클러스터는 먼저 동적 감시 기능을 활용하여 쿼럼 감시 투표를 조정합니다. 쿼럼 감시를 사용할 수 없는 경우 장애 조치(failover) 클러스터는 노드의 투표를 조정할 수 있습니다. 노드 분할이 50%이고 두 사이트에 쿼럼이 없는 경우 어떤 사이트가 유지되는지 확인하는 데 사용할 수 있는 장애 조치(failover) 클러스터 속성도 있습니다.

장애 조치(failover) 클러스터의 기능은 쿼럼뿐만 아니라 클러스터 노드에서 사용할 수 있는 리소스 및 해당 노드로 장애 조치(failover)되는 클러스터된 워크로드를 실행하는 기능에 따라 달라집니다. 예를 들어 5개 노드로 구성된 클러스터는 2개의 노드에 장애가 발생하더라도 쿼럼이 계속 유지됩니다. 그러나 나머지 각 클러스터 노드는 남은 3개 노드로 장애 조치(failover)된 클러스터 역할을 실행하는 데 충분한 리소스가 있는 경우에만 클라이언트에 서비스를 계속 제공합니다. 이러한 리소스에는 스토리지, 처리 능력, 네트워크 대역폭 및 메모리가 포함됩니다. VM 우선 순위, 시작 순서, 기본 설정 호스트 및 선호도 방지를 구성하여 클러스터 역할이 실행될 수 있는 노드를 결정할 수 있습니다.

장애 조치(failover) 클러스터링 감시 유형

장애 조치(failover) 클러스터링에 사용할 수 있는 세 가지 유형의 쿼럼 감시가 있습니다.

  • 디스크 감시는 동일한 장애 조치(failover) 클러스터의 클러스터된 디스크 리소스를 사용합니다. 모든 노드에는 공유 디스크에 대한 액세스 권한이 있어야 합니다.
  • 파일 공유 감시는 외부 파일 공유를 사용합니다. 네트워크 스위치에 연결된 USB 드라이브를 사용하여 이를 구현할 수 있습니다.
  • 클라우드 감시는 Azure Storage 계정의 BLOB을 사용합니다.

중요합니다

쿼럼 감시 유형을 선택할 때 클러스터 노드 가용성에 영향을 주는 대부분의 시나리오에서 미러링 모니터 서버가 계속 액세스할 수 있는지 확인해야 합니다.