Azure Stack HCI 버전 23H2에서 서버 복구

아티클
06/06/2024

적용 대상: Azure Stack HCI, 버전 23H2

이 문서에서는 Azure Stack HCI 클러스터에서 서버를 복구하는 방법을 설명합니다.

복구 서버 정보

Azure Stack HCI는 기존 클러스터에서 서버를 복구할 수 있는 하이퍼 컨버지드 시스템입니다. 하드웨어 오류가 있는 경우 클러스터의 서버를 복구해야 할 수 있습니다.

서버를 복구하기 전에 솔루션 공급자에게 문의해야 합니다. 서버의 구성 요소는 직접 교체할 수 있는 FRU(필드 교체 장치)이며 기술자가 교체해야 하는 구성 요소는 어느 것인가를 확인합니다.

핫 스왑을 지원하는 파트는 일반적으로 마더보드와 같이 핫스왑할 수 없는 구성 요소와 달리 서버를 이미지로 다시 설치할 필요가 없습니다. 서버를 이미지로 다시 설치해야 하는 구성 요소 교체를 확인하려면 하드웨어 제조업체에 문의하세요. 자세한 내용은 구성 요소 교체를 참조하세요.

서버 워크플로 복구

다음 흐름 다이어그램은 서버를 복구하는 전체 프로세스를 보여줍니다.

*서버가 종료가 가능하거나 필요한 상태가 아닐 수 있습니다.

기존 서버를 복구하려면 다음 개략적인 단계를 수행합니다.

가능하면 복구하려는 서버를 종료합니다. 서버 상태에 따라 종료가 불가능하거나 필요하지 않을 수 있습니다.
복구해야 하는 서버를 이미지로 다시 설치합니다.
복구 서버 작업을 실행합니다. Azure Stack HCI 운영 체제, 드라이버 및 펌웨어는 복구 작업의 일부로 업데이트됩니다.

스토리지는 이미지 다시 설치 서버에서 자동으로 균형을 조정합니다. 스토리지 재조정은 서버 수와 사용된 스토리지에 따라 며칠 동안 실행할 수 있는 낮은 우선 순위 작업입니다.

지원되는 시나리오

서버를 복구하면 서버가 이미지로 다시 설치되고 이전 이름과 구성을 사용하여 클러스터로 돌아갑니다.

단일 서버를 복구하면 데이터 볼륨을 유지하는 옵션이 포함된 재배포가 발생합니다. 배포하는 동안 시스템 볼륨만 삭제되고 새로 프로비전됩니다.

Important

워크로드에 대한 백업이 항상 있고 시스템 복원력에만 의존하지 않는지 확인합니다. 이는 단일 서버 시나리오에서 특히 중요합니다.

복원력 설정

이 릴리스에서는 서버 복구 작업을 위해 배포 후에 만든 워크로드 볼륨에서 특정 작업이 수행되지 않습니다. 서버 복구 작업의 경우 필요한 인프라 볼륨 및 워크로드 볼륨만 복원되고 CSV(클러스터 공유 볼륨)로 표시됩니다.

배포 후 만든 다른 워크로드 볼륨은 계속 유지되며 cmdlet을 실행 Get-VirtuaDisk 하여 이러한 볼륨을 검색할 수 있습니다. 볼륨의 잠금을 수동으로 해제하고(볼륨에 BitLocker를 사용하도록 설정한 경우) CSV를 만들어야 합니다(필요한 경우).

하드웨어 요구 사항

서버를 복구할 때 시스템은 들어오는 새 서버의 하드웨어의 유효성을 검사하고 서버가 클러스터에 추가되기 전에 하드웨어 요구 사항을 충족하는지 확인합니다.

구성 요소	호환성 검사
CPU	새 서버의 CPU 코어 수가 동일한지 확인합니다. 들어오는 노드의 CPU 코어가 이 요구 사항을 충족하지 않으면 경고가 표시됩니다. 그러나 작업은 허용됩니다.
메모리	새 서버에 동일한 양의 메모리가 설치되어 있는지 확인합니다. 들어오는 노드의 메모리가 이 요구 사항을 충족하지 않으면 경고가 표시됩니다. 그러나 작업은 허용됩니다.
드라이브	새 서버에 저장소 공간 Direct에 사용할 수 있는 데이터 드라이브 수가 동일한지 확인합니다. 들어오는 노드의 드라이브 수가 이 요구 사항을 충족하지 않으면 오류가 보고되고 작업이 차단됩니다.

서버 교체

전체 서버를 바꿀 수 있습니다.

이전 서버와 다른 일련 번호가 있는 새 서버를 사용합니다.
이미지로 다시 설치한 후 현재 서버를 사용합니다.

서버를 교체하는 동안 지원되는 시나리오는 다음과 같습니다.

서버	디스크	지원됨
새 서버	새 디스크	예
새 서버	현재 디스크	예
현재 서버(이미지 다시 설치)	현재 디스크 다시 포맷 *	아니요
현재 서버(이미지 다시 설치)	새 디스크	예
현재 서버(이미지 다시 설치)	현재 디스크	예

**저장소 공간 Direct에서 사용한 디스크는 적절한 정리가 필요합니다. 서식을 다시 지정하는 것으로는 충분하지 않습니다. 드라이브를 정리하는 방법을 알아보세요.

Important

서버 복구 중에 구성 요소를 교체하는 경우 데이터 드라이브를 바꾸거나 다시 설정할 필요가 없습니다. 드라이브를 교체하거나 다시 설정하는 경우 서버가 클러스터에 조인되면 드라이브가 인식되지 않습니다.

구성 요소 교체

Azure Stack HCI 클러스터에서 핫스왑이 불가능한 구성 요소에는 다음 항목이 포함됩니다.

마더보드/BMC(베이스보드 관리 컨트롤러)/비디오 카드
디스크 컨트롤러/HBA(호스트 버스 어댑터)/백플레이스
네트워크 어댑터
그래픽 처리 장치
데이터 드라이브(PCI-e 애드인 카드처럼 핫 스왑을 지원하지 않는 드라이브)

핫스왑이 불가능한 구성 요소의 실제 교체 단계는 OEM(원래 장비 제조업체) 하드웨어 공급업체에 따라 달라집니다. 핫스왑이 불가능한 구성 요소에 서버 복구가 필요한 경우 OEM 공급업체의 설명서를 참조하세요.

필수 조건

서버를 복구하기 전에 다음을 확인해야 합니다.

AzureStackLCMUser Active Directory에서 활성화되어 있습니다. 자세한 내용은 Active Directory 준비를 참조 하세요.
동일한 사용 권한이 있는 다른 사용자 또는 다른 사용자로 AzureStackLCMUser 로그인합니다.
AzureStackLCMUser 아직 변경되지 않은 자격 증명입니다.

필요한 경우 복구를 위해 식별한 서버를 오프라인으로 전환합니다. 다음 단계를 수행합니다.
- 서버를 오프라인으로 전환하기 전에 서버가 정상인지 확인합니다.
- 서버를 일시 중지하고 드레이닝합니다.
- 서버를 종료합니다.

서버 복구

이 섹션에서는 PowerShell을 사용하여 서버를 복구하고, 작업 상태를 Repair-Server 모니터링하고, 문제가 있는 경우 문제를 해결하는 방법을 설명합니다.

필수 구성 요소를 검토했는지 확인합니다.

복구하려는 서버에서 다음 단계를 수행합니다.

운영 체제 및 필수 드라이버를 설치합니다. Azure Stack HCI 버전 23H2 운영 체제 설치의 단계를 따릅니다.

참고 항목

클러스터가 스토리지에 전용 네트워크 ATC 의도를 사용하고 사용자 지정 스토리지 IP를 사용하는 경우 복구 서버 작업을 실행하기 전에 스토리지 네트워크 어댑터에서 IP를 구성해야 합니다. 클러스터가 스토리지 및 컴퓨팅 및 관리와 같은 다른 트래픽 유형에 공유 네트워크 ATC 의도를 사용하는 경우 서버를 복구한 후 스토리지 가상 네트워크 어댑터에서 IP를 수동으로 구성해야 합니다.
Arc에 서버를 등록합니다. Arc에 등록의 단계를 수행하고 사용 권한을 설정합니다.

참고 항목

Arc에 등록하려면 기존 노드와 동일한 매개 변수를 사용해야 합니다. 예: 리소스 그룹 이름, 지역, 구독 및 Tentant입니다.
복구된 노드에 다음 권한을 할당합니다.
- Azure Stack HCI 장치 관리 역할
- Key Vault 비밀 사용자에 대한 자세한 내용은 서버에 권한 할당을 참조하세요.

동일한 Azure Stack HCI 클러스터의 멤버인 다른 서버에서 다음 단계를 수행합니다.

서버를 추가하기 전에 업데이트된 인증 토큰을 가져와야 합니다. 다음 명령을 실행합니다.
```
 Update-AuthenticationToken
```
클러스터를 배포하는 동안 제공한 도메인 사용자 자격 증명을 사용하여 이미 클러스터의 멤버인 서버에 로그인합니다. 다음 명령을 실행하여 들어오는 서버를 복구합니다.
```
$Cred = Get-Credential 
Repair-Server -Name "< Name of the new server>" -LocalAdminCredential $Cred
```
참고 항목

서버 이름은 NetBIOS 이름이어야 합니다.
명령의 출력으로 작업 ID를 기록해 둡 Repair-Server 니다. 나중에 이를 사용하여 작업의 진행률을 모니터링합니다 Repair-Server .

참고 항목

사용자 지정 스토리지 IP를 사용하여 Azure Stack HCI 클러스터를 배포한 경우 서버를 복구한 후 스토리지 네트워크 어댑터에 IP를 수동으로 할당해야 합니다.

작업 진행률 모니터링

서버 추가 작업의 진행률을 모니터링하려면 다음 단계를 수행합니다.

다음 cmdlet을 실행하고 이전 단계의 작업 ID를 제공합니다.

$ID = "<Operation ID>" 
Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID

작업이 완료되면 백그라운드 스토리지 리밸런싱 작업이 계속 실행됩니다. 스토리지 리밸런스 작업이 완료되기를 기다립니다. 이 스토리지 리밸런싱 작업의 진행률을 확인하려면 다음 cmdlet을 사용합니다.
```
Get-VirtualDisk|Get-StorageJob
```
스토리지 리밸런스 작업이 완료되면 cmdlet은 출력을 반환하지 않습니다.

복구 시나리오

다음 복구 시나리오와 권장되는 완화 단계는 서버 복구를 위해 테이블로 표시됩니다.

시나리오 설명	완화	지원?
서버 복구 작업이 실패했습니다.	작업을 완료하려면 오류를 조사합니다. 를 사용하여 `Add-Server -Rerun`실패한 작업을 다시 실행합니다.	예
서버 복구 작업이 부분적으로 성공했지만 새 운영 시스템 설치로 시작해야 했습니다.	이 시나리오에서는 오케스트레이터(수명 주기 관리자라고도 함)가 이미 해당 지식 저장소를 새 서버로 업데이트했습니다. 복구 서버 시나리오를 사용합니다.	예

문제 해결

서버를 복구하는 동안 오류 또는 오류가 발생하는 경우 로그 파일에서 오류의 출력을 캡처할 수 있습니다.

클러스터를 배포하는 동안 제공한 도메인 사용자 자격 증명으로 로그인합니다. 로그 파일에서 문제를 캡처합니다.
```
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
```
실패한 작업을 다시 실행하려면 다음 cmdlet을 사용합니다.
```
Repair-Server -Rerun
```

다음 단계

서버를 추가하는 방법에 대해 자세히 알아봅니다.

다음을 통해 공유