Azure Stack HCI 버전 23H2에서 서버 복구

적용 대상: Azure Stack HCI, 버전 23H2

이 문서에서는 Azure Stack HCI 클러스터에서 서버를 복구하는 방법을 설명합니다.

복구 서버 정보

Azure Stack HCI는 기존 클러스터에서 서버를 복구할 수 있는 하이퍼 컨버지드 시스템입니다. 하드웨어 오류가 있는 경우 클러스터의 서버를 복구해야 할 수 있습니다.

서버를 복구하기 전에 솔루션 공급자와 검사. 서버의 구성 요소는 직접 대체할 수 있는 FRU(필드 교체 단위) 및 기술자가 교체해야 하는 구성 요소입니다.

핫 스왑을 지원하는 파트는 일반적으로 마더보드와 같은 핫 스왑이 불가능한 구성 요소와 달리 서버를 이미지로 다시 설치할 필요가 없습니다. 서버를 이미지로 다시 설치해야 하는 구성 요소 교체를 확인하려면 하드웨어 제조업체에 문의하세요. 자세한 내용은 구성 요소 교체를 참조하세요.

서버 워크플로 복구

다음 흐름 다이어그램은 서버를 복구하는 전체 프로세스를 보여줍니다.

복구 서버 프로세스를 보여 주는 다이어그램

*서버가 종료가 가능하거나 필요한 상태가 아닐 수 있습니다.

기존 서버를 복구하려면 다음 개략적인 단계를 수행합니다.

  1. 가능하면 복구하려는 서버를 종료합니다. 서버 상태에 따라 종료가 불가능하거나 필요하지 않을 수 있습니다.

  2. 복구해야 하는 서버를 이미지로 다시 설치합니다.

  3. 복구 서버 작업을 실행합니다. Azure Stack HCI 운영 체제, 드라이버 및 펌웨어는 복구 작업의 일부로 업데이트됩니다.

    저장소는 이미지 서버에서 자동으로 재조정됩니다. 스토리지 재조정은 서버 수와 사용된 스토리지에 따라 며칠 동안 실행할 수 있는 우선 순위가 낮은 작업입니다.

지원되는 시나리오

서버를 복구하면 서버가 이미지로 다시 설치되고 이전 이름과 구성을 사용하여 클러스터로 다시 가져옵니다.

단일 서버를 복구하면 데이터 볼륨을 유지하는 옵션이 포함된 재배포가 발생합니다. 배포하는 동안 시스템 볼륨만 삭제되고 새로 프로비전됩니다.

중요

워크로드에 대한 백업이 항상 있고 시스템 복원력에만 의존하지 않는지 확인합니다. 이는 단일 서버 시나리오에서 특히 중요합니다.

복원력 설정

이 릴리스에서는 서버 복구 작업을 위해 배포 후 만든 워크로드 볼륨에서 특정 작업이 수행되지 않습니다. 서버 복구 작업의 경우 필요한 인프라 볼륨 및 워크로드 볼륨만 복원되고 클러스터 공유 볼륨(CSV)으로 표시됩니다.

배포 후에도 만든 다른 워크로드 볼륨은 계속 유지되며 cmdlet을 실행 Get-VirtuaDisk 하여 이러한 볼륨을 검색할 수 있습니다. 볼륨의 잠금을 수동으로 해제하고(볼륨에 BitLocker를 사용하도록 설정한 경우) CSV를 만들어야 합니다(필요한 경우).

하드웨어 요구 사항

서버를 복구할 때 시스템은 들어오는 새 서버의 하드웨어의 유효성을 검사하고 서버가 클러스터에 추가되기 전에 하드웨어 요구 사항을 충족하는지 확인합니다.

구성 요소 호환성 검사
CPU 새 서버에 동일한 수 이상의 CPU 코어가 있는지 확인합니다. 들어오는 노드의 CPU 코어가 이 요구 사항을 충족하지 않으면 경고가 표시됩니다. 그러나 작업은 허용됩니다.
메모리 새 서버에 동일한 양의 메모리가 설치되어 있는지 확인합니다. 들어오는 노드의 메모리가 이 요구 사항을 충족하지 않으면 경고가 표시됩니다. 그러나 작업은 허용됩니다.
드라이브 새 서버에 저장소 공간 다이렉트 사용할 수 있는 데이터 드라이브 수가 동일한지 확인합니다. 들어오는 노드의 드라이브 수가 이 요구 사항을 충족하지 않으면 오류가 보고되고 작업이 차단됩니다.

서버 교체

전체 서버를 바꿀 수 있습니다.

  • 이전 서버와 다른 일련 번호가 있는 새 서버를 사용합니다.
  • 이미지로 다시 설치한 후 현재 서버를 사용합니다.

서버 교체 중에 지원되는 시나리오는 다음과 같습니다.

서버 디스크 지원됨
새 서버 새 디스크 Yes
새 서버 현재 디스크 Yes
현재 서버(이미지 다시 설치) 현재 디스크 다시 포맷 * No
현재 서버(이미지 다시 설치) 새 디스크 Yes
현재 서버(이미지 다시 설치) 현재 디스크 Yes

**저장소 공간 다이렉트 사용된 디스크에는 적절한 정리가 필요합니다. 다시 포맷만으로는 충분하지 않습니다. 드라이브를 정리하는 방법을 참조하세요.

중요

서버 복구 중에 구성 요소를 교체하는 경우 데이터 드라이브를 바꾸거나 다시 설정할 필요가 없습니다. 드라이브를 교체하거나 다시 설정하는 경우 서버가 클러스터에 조인되면 드라이브가 인식되지 않습니다.

구성 요소 교체

Azure Stack HCI 클러스터에서 핫 스왑할 수 없는 구성 요소에는 다음 항목이 포함됩니다.

  • 마더보드/BMC(베이스보드 관리 컨트롤러)/비디오 카드
  • 디스크 컨트롤러/HBA(호스트 버스 어댑터)/백플레이스
  • 네트워크 어댑터
  • 그래픽 처리 장치
  • 데이터 드라이브(PCI-e 애드인 카드처럼 핫 스왑을 지원하지 않는 드라이브)

핫 스왑이 불가능한 구성 요소에 대한 실제 교체 단계는 OEM(원래 장비 제조업체) 하드웨어 공급업체에 따라 달라집니다. 핫 스왑이 불가능한 구성 요소에 서버 복구가 필요한 경우 OEM 공급업체의 설명서를 참조하세요.

사전 요구 사항

서버를 복구하기 전에 다음을 확인해야 합니다.

  • AzureStackLCMUser Active Directory에서 활성 상태입니다. 자세한 내용은 Active Directory 준비를 참조하세요.
  • 동일한 권한이 있는 다른 사용자 또는 다른 사용자로 AzureStackLCMUser 로그인합니다.
  • 에 대한 자격 증명은 AzureStackLCMUser 변경되지 않았습니다.

서버 복구

이 섹션에서는 PowerShell을 사용하여 서버를 복구하고, 작업의 상태 Repair-Server 모니터링하고, 문제가 있는 경우 문제를 해결하는 방법을 설명합니다.

필수 구성 요소를 검토했는지 확인합니다.

복구하려는 서버에서 다음 단계를 수행합니다.

  1. 운영 체제 및 필수 드라이버를 설치합니다. Azure Stack HCI 버전 23H2 운영 체제 설치의 단계를 따릅니다.

    참고

    필요한 Windows 역할도 설치해야 합니다.

  2. Arc에 서버를 등록합니다. Arc에 등록 및 사용 권한 설정의 단계를 수행합니다.

    참고

    Arc에 등록하려면 기존 노드와 동일한 매개 변수를 사용해야 합니다. 예: 리소스 그룹 이름, 지역, 구독 및 Tentant입니다.

동일한 Azure Stack HCI 클러스터의 구성원인 다른 서버에서 다음 단계를 수행합니다.

  1. 서버를 추가하기 전에 업데이트된 인증 토큰을 가져와야 합니다. 다음 명령 실행:

     Update-AuthenticationToken
    
  2. 클러스터 배포 중에 제공한 도메인 사용자 자격 증명을 사용하여 이미 클러스터의 멤버인 서버에 로그인합니다. 다음 명령을 실행하여 들어오는 서버를 복구합니다.

    $Cred = Get-Credential 
    Repair-Server -Name "< Name of the new server>" -LocalAdminCredential $Cred
    
  3. 명령의 출력으로 작업 ID를 기록해 Repair-Server 둡니다. 나중에 이를 사용하여 작업의 진행률을 모니터링합니다 Repair-Server .

작업 진행률 모니터링

서버 추가 작업의 진행률을 모니터링하려면 다음 단계를 수행합니다.

  1. 다음 cmdlet을 실행하고 이전 단계의 작업 ID를 제공합니다.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. 작업이 완료되면 백그라운드 스토리지 리밸런싱 작업이 계속 실행됩니다. 스토리지 리밸런스 작업이 완료되기를 기다립니다. 이 스토리지 리밸런싱 작업의 진행률을 확인하려면 다음 cmdlet을 사용합니다.

    Get-VirtualDisk|Get-StorageJob
    

    스토리지 리밸런스 작업이 완료되면 cmdlet은 출력을 반환하지 않습니다.

복구 시나리오

다음 복구 시나리오 및 권장 완화 단계는 서버 복구를 위해 표로 표시됩니다.

시나리오 설명 완화 방법 지원 여부
서버 복구 작업이 실패했습니다. 작업을 완료하려면 오류를 조사합니다.
를 사용하여 Add-Server -Rerun실패한 작업을 다시 실행합니다.
Yes
복구 서버 작업은 부분적으로 성공했지만 새 운영 시스템 설치로 시작해야 했습니다. 이 시나리오에서 오케스트레이터(수명 주기 관리자라고도 함)는 이미 새 서버로 지식 저장소를 업데이트했습니다. 복구 서버 시나리오를 사용합니다. Yes

문제 해결

서버를 복구하는 동안 오류 또는 오류가 발생하는 경우 로그 파일에서 오류의 출력을 캡처할 수 있습니다.

  • 클러스터를 배포하는 동안 제공한 도메인 사용자 자격 증명으로 로그인합니다. 로그 파일에서 문제를 캡처합니다.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • 실패한 작업을 다시 실행하려면 다음 cmdlet을 사용합니다.

    Repair-Server -Rerun
    

다음 단계

서버를 추가하는 방법에 대해 자세히 알아봅니다.