SQL Server Always On 가용성 그룹과 Always On 장애 조치 클러스터 인스턴스(FCI)는 모두 Windows Server 장애 조치 클러스터링(WSFC)을 플랫폼 기술로 활용합니다. WSFC는 쿼럼 기반 접근 방식을 사용하여 전체 클러스터 상태를 모니터링하고 노드 수준 내결함성을 최대화합니다. WSFC 쿼럼 모드 및 노드 투표 구성에 대한 기본적인 이해는 AlwaysOn 고가용성 및 재해 복구 솔루션을 설계, 운영 및 문제 해결에 매우 중요합니다.
이 주제에서:
쿼럼을 통한 클러스터 상태 감지
WSFC 클러스터의 각 노드는 정기적인 하트비트 통신에 참여하여 노드의 상태를 다른 노드와 공유합니다. 응답하지 않는 노드는 실패한 상태로 간주됩니다.
쿼럼 노드 집합은 WSFC 클러스터에서 투표 노드 및 증인의 과반수입니다. WSFC 클러스터의 전반적인 상태 및 상태는 정기적인 쿼럼 투표에 의해 결정됩니다. 쿼럼이 있으면 클러스터가 정상 상태이며 노드 수준 내결함성을 제공할 수 있습니다.
쿼럼이 없는 경우 클러스터가 정상이 아님을 나타냅니다. 주 노드들이 장애 조치(failover)할 수 있도록 건강한 보조 노드들이 제공될 수 있게 WSFC 클러스터 전체 상태가 유지되어야 합니다. 쿼럼 투표가 실패하면 WSFC 클러스터는 예방 조치로 오프라인으로 설정됩니다. 이렇게 하면 클러스터에 등록된 모든 SQL Server 인스턴스가 중지됩니다.
중요합니다
쿼럼 오류로 인해 WSFC 클러스터가 오프라인으로 설정된 경우 다시 온라인 상태로 전환하려면 수동 개입이 필요합니다.
자세한 내용은 다음을 참조하세요. 강제 쿼럼을 통한 WSFC 재해 복구(SQL Server).
쿼럼 모드
쿼럼 모드는 WSFC 클러스터 수준에서 구성되며, 이는 쿼럼 투표에 사용하는 방법론을 결정합니다. 장애 조치(failover) 클러스터 관리자 유틸리티는 클러스터의 노드 수에 따라 쿼럼 모드를 권장합니다.
다음 쿼럼 모드를 사용하여 투표 쿼럼을 구성하는 요소를 결정할 수 있습니다.
노드 과반수. 클러스터의 투표 노드 중 절반 이상이 클러스터가 정상이 되도록 긍정적으로 투표해야 합니다.
노드 및 파일 공유 과반수. 노드 과반수 쿼럼 모드와 비슷하지만 원격 파일 공유도 투표 감시로 구성되고 노드에서 해당 공유로의 연결도 긍정적 투표로 계산됩니다. 클러스터가 정상이 되려면 가능한 투표의 절반 이상이 긍정적이어야 합니다.
감시 파일 공유는 클러스터의 노드에 있으면 안 되며 클러스터의 모든 노드에 표시되는 것이 가장 좋습니다.
노드 및 디스크 과반수. 공유 디스크 클러스터 리소스도 투표 감시로 지정되고 모든 노드에서 해당 공유 디스크로의 연결도 긍정 투표로 계산된다는 점을 제외하고 노드 과반수 쿼럼 모드와 유사합니다. 클러스터가 정상이 되려면 가능한 투표의 절반 이상이 긍정적이어야 합니다.
디스크 전용입니다. 공유 디스크 클러스터 리소스는 감시로 지정되며 해당 공유 디스크에 대한 노드의 연결은 긍정 투표로 계산됩니다.
팁 (조언)
Always On 가용성 그룹에 대해 비대칭 스토리지 구성을 사용하는 경우 일반적으로 투표 노드 수가 홀수인 경우 노드 과반수 쿼럼 모드를 사용하거나 짝수의 투표 노드가 있는 경우 노드 및 파일 공유 과반수 쿼럼 모드를 사용해야 합니다.
투표 및 비투표 노드
기본적으로 WSFC 클러스터의 각 노드는 클러스터 쿼럼의 멤버로 포함됩니다. 각 노드는 전체 클러스터 상태를 결정하는 단일 투표를 가지며, 각 노드는 지속적으로 쿼럼을 설정하려고 시도합니다. 지금까지 쿼럼에 대한 논의는 클러스터 상태에 투표하는 WSFC 클러스터 노드 집합을 투표 노드로 신중하게 정의했습니다.
WSFC 클러스터의 개별 노드는 클러스터 전체가 정상 또는 비정상 상태임을 확실하게 확인할 수 없습니다. 특정 시점에 각 노드의 관점에서 다른 노드 중 일부는 오프라인으로 표시되거나 장애 조치(failover) 프로세스에 있는 것처럼 보이거나 네트워크 통신 오류로 인해 응답하지 않는 것처럼 보일 수 있습니다. 쿼럼 투표의 핵심 기능은 WSFC 클러스터에 있는 각 노드의 명백한 상태가 실제로 해당 노드의 실제 상태인지 여부를 확인하는 것입니다.
'디스크만'을 제외한 모든 쿼럼 모델의 경우 쿼럼 투표의 효과는 클러스터의 모든 투표 노드 간의 신뢰할 수 있는 통신에 따라 달라집니다. 동일한 물리적 서브넷의 노드 간 네트워크 통신은 신뢰할 수 있는 것으로 간주되어야 합니다. 쿼럼 투표를 신뢰할 수 있어야 합니다.
그러나 다른 서브넷의 노드가 쿼럼 투표에서 응답하지 않는 것으로 보이지만 실제로 온라인 상태이고 그렇지 않으면 정상인 경우 서브넷 간의 네트워크 통신 오류로 인해 발생할 가능성이 큽니다. 클러스터 토폴로지, 쿼럼 모드 및 장애 조치(failover) 정책 구성에 따라 네트워크 통신 오류가 효과적으로 둘 이상의 투표 노드 집합(또는 하위 집합)을 만들 수 있습니다.
둘 이상의 투표 노드 하위 집합이 자체적으로 쿼럼을 설정할 수 있는 경우 분할 브레인 시나리오라고 합니다. 이러한 시나리오에서는 별도의 쿼럼의 노드가 다르게 동작하고 서로 충돌할 수 있습니다.
비고
분할 브레인 시나리오는 시스템 관리자가 강제 쿼럼 작업을 수동으로 수행하거나 매우 드문 상황에서 강제 장애 조치(failover)를 수행할 때만 가능합니다. 쿼럼 노드 집합을 명시적으로 세분화합니다.
쿼럼 구성을 간소화하고 업타임을 늘리기 위해 노드의 투표가 쿼럼에 계산되지 않도록 각 노드의 NodeWeight 설정을 조정할 수 있습니다.
중요합니다
NodeWeight 설정을 사용하려면 WSFC 클러스터의 모든 서버에 다음 핫픽스를 적용해야 합니다.
KB2494036: Windows Server 2008 및 Windows Server 2008 R2에서 쿼럼 투표가 없는 클러스터 노드를 구성하는 데 사용할 수 있는 핫픽스
쿼럼 투표에 대한 권장 조정
지정된 WSFC 노드의 투표를 사용하거나 사용하지 않도록 설정하는 경우 다음 지침을 따릅니다.
기본적으로 투표는 없습니다. 각 노드가 명시적 근거 없이 투표해서는 안 된다고 가정합니다.
모든 주 복제본을 포함합니다. 가용성 그룹 기본 복제본을 호스트하거나 FCI의 선호 소유자인 각 WSFC 노드는 투표를 해야 합니다.
가능한 자동 장애 조치(failover) 소유자를 포함합니다. 자동 가용성 그룹 장애 조치나 FCI 장애 조치의 결과로 주 복제본을 호스팅할 수 있는 각 노드에는 투표가 있어야 합니다. WSFC 클러스터에 가용성 그룹이 하나만 있고 가용성 복제본이 독립 실행형 인스턴스에서만 호스트되는 경우 이 규칙에는 자동 장애 조치 대상인 보조 복제본만 포함됩니다.
보조 사이트 노드를 제외합니다. 일반적으로 보조 재해 복구 사이트에 상주하는 WSFC 노드에 대한 투표를 제공하지 않습니다. 기본 사이트에 문제가 없는 경우 보조 사이트의 노드가 클러스터를 오프라인으로 전환하기로 결정하는 데 기여하지 않도록 합니다.
투표 수가 홀수입니다. 필요한 경우 감시 파일 공유, 감시 노드 또는 감시 디스크를 클러스터에 추가하고 쿼럼 투표에서 가능한 관계를 방지하도록 쿼럼 모드를 조정합니다.
장애 조치(failover) 후 투표 할당을 다시 검토합니다. 정상 쿼럼을 지원하지 않는 클러스터 구성으로 장애 조치를 피하고 싶습니다.
중요합니다
WSFC 쿼럼 투표 구성의 유효성을 검사할 때 AlwaysOn 가용성 그룹 마법사는 다음 조건 중 하나라도 충족되면 경고를 표시합니다.
- 주 복제본을 호스트하는 클러스터 노드에 투표가 없습니다.
- 보조 복제본은 자동 장애 조치(failover)를 위해 구성되며 클러스터 노드에는 투표가 없습니다.
- KB2494036 가용성 복제본을 호스트하는 모든 클러스터 노드에 설치되지 않습니다. 이 패치는 다중 사이트 배포에서 클러스터 노드에 대한 투표를 추가하거나 제거하는 데 필요합니다. 그러나 단일 사이트 배포에서는 일반적으로 필요하지 않으며 경고를 무시해도 됩니다.
팁 (조언)
SQL Server는 WSFC 클러스터 구성 및 노드 쿼럼 투표와 관련된 설정을 관리하는 데 도움이 되는 여러 DMV(시스템 동적 관리 뷰)를 노출합니다.
자세한 내용은 다음을 참조하세요: sys.dm_hadr_cluster, sys.dm_hadr_cluster_members, sys.dm_os_cluster_nodes, sys.dm_hadr_cluster_networks
관련 작업
관련 내용
Windows Server 기술들: 장애 조치 클러스터링
또한 참조하십시오
강제 쿼럼을 통해 WSFC 재해 복구(SQL Server)
Windows Server 장애 조치 클러스터링(WSFC)과 SQL Server