Azure Stack HCI 클러스터 유효성 검사

적용 대상: Azure Stack HCI, 버전 22H2 및 21H2; Windows Server 2022, Windows Server 2019.

경고

이 문서에 제공된 배포 지침은 이전 버전인 Azure Stack HCI 버전 22H2에 적용됩니다. 새 배포의 경우 최신 일반 공급 버전인 Azure Stack HCI 버전 23H2를 사용하는 것이 좋습니다. 배포 지침은 Azure Stack HCI 버전 23H2 배포 정보를 참조하세요.

DCB 유효성 검사는 더 이상 Azure Stack HCI에서 호스트 네트워킹 구성을 설정하거나 테스트하는 데 권장되는 도구가 아닙니다. 네트워크 ATC를 사용하여 Azure Stack HCI에 대한 호스트 네트워킹 설정을 구성하는 것이 좋습니다. 네트워크 ATC는 항상 Azure Stack HCI에서 DCB 유효성 검사를 대체합니다.

Windows Admin Center 클러스터 만들기 마법사는 특정 유효성 검사를 수행하여 선택한 하드웨어를 사용하여 작업 클러스터를 만들지만 클러스터 유효성 검사는 추가 검사를 수행하여 클러스터가 프로덕션 환경에서 작동하는지 확인합니다. 이 방법 문서에서는 클러스터 유효성 검사가 중요한 이유와 Azure Stack HCI 클러스터에서 클러스터 유효성 검사를 실행하는 경우에 중점을 둡니다.

다음 기본 시나리오에 대해 클러스터 유효성 검사를 수행하는 것이 좋습니다.

  • 서버 클러스터를 배포한 후 Validate-DCB 도구를 실행하여 네트워킹을 테스트합니다.
  • 서버 클러스터를 업데이트한 후 시나리오에 따라 두 유효성 검사 옵션을 모두 실행하여 클러스터 문제를 해결합니다.
  • 스토리지 복제본을 사용하여 복제를 설정한 후 일부 특정 이벤트를 확인하고 몇 가지 명령을 실행하여 복제가 정상적으로 진행되고 있는지 확인합니다.
  • 서버 클러스터를 만든 후 프로덕션 환경에 배치하기 전에 Validate-DCB 도구를 실행합니다.

클러스터 유효성 검사란?

클러스터 유효성 검사는 클러스터가 프로덕션으로 전환되기 전에 하드웨어 또는 구성 문제를 파악하기 위한 것입니다. 클러스터 유효성 검사를 통해 배포하려는 Azure Stack HCI 솔루션이 진정으로 신뢰할 수 있는지 확인할 수 있습니다. 구성된 장애 조치(failover) 클러스터에서 클러스터 유효성 검사를 진단 도구로 사용할 수도 있습니다.

특정 유효성 검사 시나리오

이 섹션에서는 유효성 검사도 필요하거나 유용한 시나리오에 대해 설명합니다.

  • 클러스터가 구성되기 전에 유효성 검사:

    • 장애 조치(failover) 클러스터가 될 준비가 된 서버 집합: 가장 간단한 유효성 검사 시나리오입니다. 하드웨어 구성 요소(시스템, 네트워크 및 스토리지)가 연결되어 있지만 시스템은 아직 클러스터로 작동하지 않습니다. 이 상황에서 테스트를 실행해도 가용성에는 영향을 주지 않습니다.

    • 서버 VM: 클러스터의 가상화된 서버의 경우 다른 새 클러스터에서와 마찬가지로 클러스터 유효성 검사를 실행합니다. 이 기능을 실행해야 하는 요구 사항은 다음과 같은 경우와 동일합니다.

      • 두 물리적 컴퓨터 간에 장애 조치(failover)가 발생하는 "호스트 클러스터"입니다.
      • 동일한 물리적 컴퓨터의 게스트 운영 체제 간에 장애 조치(failover)가 발생하는 "게스트 클러스터"입니다.
  • 클러스터가 구성되고 사용 중인 후 유효성 검사:

    • 클러스터에 서버를 추가하기 전에 다음을 수행합니다 . 클러스터에 서버를 추가할 때 클러스터의 유효성을 검사하는 것이 좋습니다. 클러스터 유효성 검사를 실행할 때 기존 클러스터 멤버와 새 서버를 모두 지정합니다.

    • 드라이브를 추가하는 경우: 실패한 드라이브를 바꾸거나 기존 드라이브에 의존하는 가상 디스크 또는 볼륨을 만드는 것과 다른 클러스터에 드라이브를 추가하는 경우 클러스터 유효성 검사를 실행하여 새 스토리지가 올바르게 작동하는지 확인합니다.

    • 펌웨어 또는 드라이버에 영향을 주는 변경을 수행할 때: 펌웨어 또는 드라이버에 영향을 주는 클러스터를 업그레이드하거나 변경하는 경우 클러스터 유효성 검사를 실행하여 하드웨어, 펌웨어, 드라이버 및 소프트웨어의 새로운 조합이 장애 조치(failover) 클러스터 기능을 지원하는지 확인해야 합니다.

    • 백업에서 시스템을 복원한 후: 백업에서 시스템을 복원한 후 클러스터 유효성 검사를 실행하여 시스템이 클러스터의 일부로 올바르게 작동하는지 확인합니다.

네트워킹 유효성 검사

Microsoft Validate-DCB 도구는 클러스터에서 DCB(데이터 센터 브리징) 구성의 유효성을 검사하도록 설계되었습니다. 이를 위해 도구는 예상된 구성을 입력으로 사용하고 클러스터의 각 서버를 테스트합니다. 이 섹션에서는 Validate-DCB 도구를 설치 및 실행하고, 결과를 검토하고, 도구에서 식별하는 네트워킹 오류를 resolve 방법에 대해 설명합니다.

참고

Microsoft는 네트워크 ATC를 사용하여 구성을 배포하고 관리하는 것이 좋습니다. 이 경우 Validate-DCB 도구에서 검사하는 대부분의 구성 문제가 제거됩니다. 네트워크 배포를 호스트하기 위한 의도 기반 접근 방식을 제공하는 네트워크 ATC에 대한 자세한 내용은 네트워크 ATC를 사용하여 호스트 네트워킹 간소화를 참조하세요.

네트워크에서 RoCE(Converged Ethernet)를 통해 RDMA(원격 직접 메모리 액세스)를 사용하려면 네트워크 패브릭을 무손실로 만들기 위해 DCB 기술이 필요합니다. iWARP를 사용하면 DCB는 선택 사항입니다. 그러나 DCB 구성은 복잡할 수 있으며 다음과 같은 경우에 정확한 구성이 필요합니다.

  • 클러스터의 각 서버
  • RDMA 트래픽이 패브릭에서 통과하는 각 네트워크 포트

사전 요구 사항

  • 다음을 포함하여 유효성을 검사하려는 서버 클러스터의 네트워크 설정 정보입니다.
    • 호스트 또는 서버 클러스터 이름
    • 가상 스위치 이름
    • 네트워크 어댑터 이름
    • PFC(우선 순위 흐름 제어) 및 ETS(향상된 전송 선택) 설정
  • Microsoft에서 Windows PowerShell 도구 모듈을 다운로드하는 인터넷 연결입니다.

Validate-DCB 도구 설치 및 실행

Validate-DCB 도구를 설치하고 실행하려면 다음을 수행합니다.

  1. 관리 PC에서 관리자 권한으로 Windows PowerShell 세션을 연 다음, 다음 명령을 사용하여 도구를 설치합니다.

    Install-Module Validate-DCB
    
  2. NuGet 공급자를 사용하도록 요청을 수락하고 리포지토리에 액세스하여 도구를 설치합니다.

  3. PowerShell이 Microsoft 네트워크에 연결하여 도구를 다운로드한 후 EnterValidate-DCB 키를 눌러 도구 마법사를 시작합니다.

    참고

    Validate-DCB 도구 스크립트를 실행할 수 없는 경우 PowerShell 실행 정책을 조정해야 할 수 있습니다. Get-ExecutionPolicy cmdlet을 사용하여 현재 스크립트 실행 정책 설정을 봅니다. PowerShell에서 실행 정책을 설정하는 방법에 대한 자세한 내용은 실행 정책 정보를 참조하세요.

  4. 유효성 검사-DCB 구성 마법사 시작 페이지에서 다음을 선택합니다.

  5. 클러스터 및 노드 페이지에서 유효성을 검사할 서버 클러스터의 이름을 입력하고 해결 을 선택하여 페이지에 나열한 다음 , 다음을 선택합니다.

    유효성 검사-DCB 구성 마법사의 클러스터 및 노드 페이지

  6. 어댑터 페이지에서 다음을 수행합니다.

    1. vSwitch 연결 확인란을 선택하고 vSwitch의 이름을 입력합니다.
    2. 어댑터 이름 아래에 각 물리적 NIC의 이름, 호스트 vNIC 이름, 각 vNIC(가상 NIC) 이름, VLAN 아래에 각 어댑터에 사용 중인 VLAN ID를 입력합니다.
    3. RDMA 유형 드롭다운 목록 상자를 확장하고 적절한 프로토콜인 RoCE 또는 iWARP를 선택합니다. 또한 Jumbo 프레임을 네트워크에 적합한 값으로 설정한 다음, 다음을 선택합니다.

    유효성 검사-DCB 구성 마법사의 어댑터 페이지

    참고

  7. 데이터 센터 브리징 페이지에서 우선 순위, 정책 이름대역폭 예약에 대한 organization 설정과 일치하도록 값을 수정한 다음, 다음을 선택합니다.

    유효성 검사-DCB 구성 마법사의 데이터 센터 브리징 페이지

    참고

    이전 마법사 페이지에서 ROCE를 통해 RDMA를 선택하려면 모든 NIC 및 스위치포트에서 네트워크 안정성을 위해 DCB가 필요합니다.

  8. 저장 및 배포 페이지의 구성 파일 경로 상자에서 필요한 경우 나중에 다시 사용할 수 있는 위치에.ps1확장을 사용하여 구성 파일을 저장한 다음 내보내기를 선택하여 Validate-DCB 도구 실행을 시작합니다.

    • 필요에 따라 페이지의 노드에 구성 배포 섹션을 완료하여 구성 파일을 배포할 수 있습니다. 여기에는 Azure Automation 계정을 사용하여 구성을 배포한 다음 유효성을 검사하는 기능이 포함됩니다. Azure Automation 시작하려면 Azure Automation 계정 만들기를 참조하세요.

    유효성 검사-DCB 구성 마법사의 저장 및 배포 페이지

결과 검토 및 오류 수정

Validate-DCB 도구는 다음 두 단위로 결과를 생성합니다.

  1. [전역 단위] 결과는 모달 테스트를 실행하기 위한 필수 구성 요소 및 요구 사항을 나열합니다.
  2. [모달 단위] 결과는 각 클러스터 호스트 구성 및 모범 사례에 대한 피드백을 제공합니다.

이 예제에서는 실패한 개수 0을 표시하여 모든 필수 구성 요소 및 모달 단위 테스트에 대한 단일 서버의 성공적인 검사 결과를 보여 줍니다.

Validate-DCB 전역 단위 및 모달 단위 테스트 결과

다음 단계에서는 vNIC SMB02에서 점보 패킷 오류를 식별하고 수정하는 방법을 보여줍니다.

  1. Validate-DCB 도구 검사 결과에 실패한 수 오류 1이 표시됩니다.

    실패한 수 오류 1을 보여 주는 Validate-DCB 도구 검사 결과

  2. 결과를 다시 스크롤하면 호스트 S046036 vNIC SMB02에 대한 점보 패킷이 기본 크기인 1514로 설정되어 있지만 9014로 설정되어야 함을 나타내는 빨간색 오류가 표시됩니다.

    점보 패킷 크기 설정 오류를 보여 주는 Validate-DCB 도구 검사 결과

  3. 호스트 S046036 vNIC SMB02의 고급 속성을 검토하면 Jumbo 패킷이 기본값인 Disabled로 설정되어 있음을 보여 줍니다.

    서버 호스트의 Hyper-V 고급 속성 점보 패킷 설정

  4. 오류를 해결하려면 점보 패킷 기능을 사용하도록 설정하고 크기를 9014바이트로 변경해야 합니다. 호스트 S046036 검사를 다시 실행하면 실패한 횟수 0을 반환하여 이 변경 내용이 확인됩니다.

    서버 호스트의 Jumbo 패킷 설정이 고정되어 있는지 확인하는 유효성 검사-DCB 검사 결과

Validate-DCB 도구에서 식별하는 오류를 해결하는 방법에 대한 자세한 내용은 다음 비디오를 참조하세요.

도구를 오프라인으로 설치할 수도 있습니다. 연결이 끊긴 시스템의 경우 c:\temp\Validate-DCB의 모듈을 연결이 끊긴 시스템으로 이동한 다음 사용합니다 Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB . 자세한 내용은 다음 비디오를 참조하세요.

클러스터 유효성 검사

다음 단계를 사용하여 Windows Admin Center 기존 클러스터의 서버 유효성을 검사합니다.

  1. Windows Admin Center 모든 연결에서 유효성을 검사할 Azure Stack HCI 클러스터를 선택한 다음 연결을 선택합니다.

    클러스터 관리자 대시보드에는 클러스터에 대한 개요 정보가 표시됩니다.

  2. 클러스터 관리자 대시보드도구에서 서버를 선택합니다.

  3. 인벤토리 페이지에서 클러스터의 서버를 선택한 다음, 추가 하위 메뉴 를 확장하고 클러스터 유효성 검사를 선택합니다.

  4. 클러스터 유효성 검사 팝업 창에서 예를 선택합니다.

    클러스터 팝업 창 유효성 검사

  5. CredSSP(자격 증명 보안 서비스 공급자) 팝업 창에서 예를 선택합니다.

  6. 자격 증명을 제공하여 CredSSP를 사용하도록 설정한 다음 , 계속을 선택합니다.
    클러스터 유효성 검사는 백그라운드에서 실행되며 완료되면 다음 섹션에 설명된 대로 유효성 검사 보고서를 볼 수 있는 알림을 제공합니다.

참고

클러스터 서버의 유효성을 검사한 후에는 보안상의 이유로 CredSSP를 사용하지 않도록 설정해야 합니다.

CredSSP 사용 안 함

서버 클러스터의 유효성을 성공적으로 검사한 후에는 보안을 위해 각 서버에서 CredSSP(자격 증명 보안 지원 공급자) 프로토콜을 사용하지 않도록 설정해야 합니다. 자세한 내용은 CVE-2018-0886을 참조하세요.

  1. Windows Admin Center 모든 연결에서 클러스터의 첫 번째 서버를 선택한 다음 연결을 선택합니다.

  2. 개요 페이지에서 CredSSP 사용 안 함을 선택한 다음 CredSSP 사용 안 함 팝업 창에서 예를 선택합니다.

    2단계의 결과는 서버 개요 페이지 맨 위에 있는 빨간색 CredSSP ENABLED 배너를 제거하고 다른 서버에서 CredSSP를 사용하지 않도록 설정합니다.

유효성 검사 보고서 보기

이제 클러스터 유효성 검사 보고서를 볼 준비가 되었습니다.

유효성 검사 보고서에 액세스하는 몇 가지 방법이 있습니다.

  • 인벤토리 페이지에서 추가 하위 메뉴 를 확장한 다음 유효성 검사 보고서 보기를 선택합니다.

  • Windows Admin Center 오른쪽 위에서 알림 벨 아이콘 선택하여 알림 창을 표시합니다. 성공적으로 유효성을 검사한 클러스터 알림을 선택한 다음 장애 조치(failover) 클러스터 유효성 검사 보고서로 이동을 선택합니다.

참고

서버 클러스터 유효성 검사 프로세스를 완료하는 데 다소 시간이 걸릴 수 있습니다. 프로세스가 실행되는 동안 Windows Admin Center 다른 도구로 전환하지 마세요. 알림 창에서 클러스터 유효성 검사 알림 아래의 상태 표시줄은 프로세스가 완료된 시기를 나타냅니다.

PowerShell을 사용하여 클러스터 유효성 검사

Windows PowerShell 사용하여 서버 클러스터에서 유효성 검사 테스트를 실행하고 결과를 볼 수도 있습니다. 클러스터가 설정되기 전과 후에 테스트를 실행할 수 있습니다.

서버 클러스터에서 유효성 검사 테스트를 실행하려면 관리 PC에서 Get-ClusterTest-Cluster<서버 클러스터 이름> PowerShell cmdlet을 실행하거나 클러스터에서 직접 Test-Cluster cmdlet만 실행합니다.

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

자세한 예제 및 사용 정보는 Test-Cluster 참조 설명서를 참조하세요.

Test-NetStack 은 GitHub에서 사용할 수 있는 PowerShell 기반 테스트 도구로, 네트워크의 ICMP, TCP 및 RDMA 트래픽 테스트를 수행하고 잠재적인 네트워크 패브릭을 식별하고 잘못된 구성 또는 운영 불안정을 호스트하는 데 사용할 수 있습니다. Test-NetStack 사용하여 연결, 패킷 조각화, 낮은 처리량 및 정체와 관련된 문제에 대한 네이티브, 가상 및 하드웨어 오프로드(RDMA) 네트워크 데이터 경로를 테스트하여 네트워크 데이터 경로의 유효성을 검사합니다.

스토리지 복제본에 대한 복제 유효성 검사

스토리지 복제본을 사용하여 확장된 클러스터 또는 클러스터 간 볼륨을 복제하는 경우 복제 상태를 가져오는 데 사용할 수 있는 여러 이벤트 및 cmdlet이 있습니다.

다음 시나리오에서는 두 사이트에 대한 복제 그룹(RG)을 만들어 스토리지 복제본을 구성한 다음 Site1(Server1, Server2)의 원본 서버 노드와 Site2(Server3, Server4)의 대상(복제된) 서버 노드 모두에 대한 데이터 볼륨 및 로그 볼륨을 지정했습니다.

Site1에서 Server1의 복제 진행률을 확인하려면 Get-WinEvent 명령을 실행하고 이벤트 5015, 5002, 5004, 1237, 5001 및 2200을 검사합니다.

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

Site2의 Server3에 대해 다음 Get-WinEvent 명령을 실행하여 파트너 관계 만들기를 보여 주는 스토리지 복제본 이벤트를 확인합니다. 이 이벤트는 복사한 바이트 수와 걸린 시간을 알려 줍니다. 예를 들면 다음과 같습니다.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

Site2의 Server3에 대해 명령을 실행하고 Get-WinEvent 이벤트 5009, 1237, 5001, 5015, 5005 및 2200을 검사하여 처리 진행 상황을 이해합니다. 이 시퀀스에는 오류 경고가 없어야 합니다. 많은 1237 이벤트가 있을 것입니다 - 이것은 진행률을 나타냅니다.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

또는 복제본(replica) 대상 서버 그룹은 항상 복사할 남은 바이트 수를 명시하고 를 사용하여 PowerShellGet-SRGroup을 통해 쿼리할 수 있습니다. 예를 들면 다음과 같습니다.

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

Site2의 노드 Server3에 대해 다음 명령을 실행하고 이벤트 5009, 1237, 5001, 5015, 5005 및 2200을 검사하여 복제 진행 상황을 이해합니다. 오류에 대한 경고는 없어야 합니다. 그러나 많은 "1237" 이벤트가 있을 것입니다 .

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

종료되지 않는 진행률 스크립트로:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

확장된 클러스터 내에서 복제 상태를 얻으려면 및 Get-SRPartnership를 사용합니다Get-SRGroup.

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

사이트 간에 성공적인 데이터 복제가 확인되면 VM 및 기타 워크로드를 만들 수 있습니다.

추가 정보