클러스터형 VM에서 GPU 사용

아티클
08/08/2024

적용 대상: Windows Server 2025(미리 보기)

Important

Windows Server 2025에서 클러스터형 VM이 있는 GPU는 미리 보기로 제공됩니다. 이 정보는 릴리스되기 전에 상당히 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보와 관련하여 명시적이거나 묵시적인 어떠한 보증도 하지 않습니다.

적용 대상: Azure Stack HCI, 버전 23H2 및 22H2

참고 항목

Azure Stack HCI 23H2에서 VM을 만들고 관리하는 권장 방법은 Azure Arc 컨트롤 플레인을 사용하는 것입니다. Azure Arc VM에서 사용할 수 없는 기능이 필요한 경우에만 아래에 설명된 메커니즘을 사용하여 VM을 관리합니다.

클러스터에 GPU를 포함하여 클러스터된 VM에서 실행되는 워크로드에 GPU 가속을 제공할 수 있습니다. GPU 가속은 DDA(불연속 디바이스 할당)를 통해 제공될 수 있으며, 이를 통해 하나 이상의 물리적 GPU를 VM에 헌정하거나 GPU 분할을 통해 사용할 수 있습니다. 클러스터형 VM은 장애 조치(failover)를 통해 GPU 가속 및 클러스터링 기능(예: 고가용성)을 활용할 수 있습니다. VM(가상 머신)의 실시간 마이그레이션은 현재 지원되지 않지만, 오류가 발생한 경우 VM을 자동으로 다시 시작하고 GPU 리소스를 사용할 수 있는 위치에 배치할 수 있습니다.

이 문서에서는 클러스터형 VM에서 GPU(그래픽 처리 장치)를 사용하여 개별 디바이스 할당을 사용하여 워크로드에 GPU 가속을 제공하는 방법을 알아봅니다. 이 문서에서는 클러스터를 준비하고, 클러스터 VM에 GPU를 할당하고, Windows Admin Center 및 PowerShell을 사용하여 해당 VM을 장애 조치(failover)하는 방법을 안내합니다.

필수 조건

클러스터형 VM에서 GPU를 사용하기 전에 고려해야 할 몇 가지 요구 사항과 사항이 있습니다.

Azure Stack HCI 버전 22H2 이상을 실행하는 Azure Stack HCI 클러스터가 필요합니다.

Windows Server 2025 이상을 실행하는 Windows Server 장애 조치(failover) 클러스터가 필요합니다.

클러스터의 모든 서버에서 GPU와 동일한 구성 및 모델을 설치해야 합니다.
GPU 제조업체의 지침을 검토하고 따라 클러스터의 각 서버에 필요한 드라이버와 소프트웨어를 설치합니다.
하드웨어 공급업체에 따라 GPU 라이선스 요구 사항을 구성해야 할 수도 있습니다.
Windows Admin Center가 설치된 컴퓨터가 필요합니다. 이 컴퓨터는 클러스터 노드 중 하나일 수 있습니다.

GPU를 할당할 VM을 만듭니다. 개별 디바이스 할당을 사용하여 그래픽 디바이스 배포의 지침에 따라 캐시 동작, 중지 작업 및 메모리 매핑 I/O(I/O) 속성을 설정하여 DDA용 VM을 준비합니다.
각 서버에 보안 완화 드라이버를 설치하고, GPU를 사용하지 않도록 설정한 다음, 호스트에서 분리하여 각 서버에서 GPU를 준비합니다. 이 프로세스 에 대한 자세한 내용은 개별 디바이스 할당을 사용하여 그래픽 디바이스 배포를 참조하세요.

개별 디바이스 할당을 사용하여 클러스터에서 GPU 디바이스를 준비하여 디바이스 배포 계획의 단계를 따릅니다.
디바이스에 VM 내에 할당된 충분한 MMIO 공간이 있는지 확인합니다. 자세한 내용은 MMIO 공간을 참조 하세요.
GPU를 할당할 VM을 만듭니다. 개별 디바이스 할당을 사용하여 그래픽 디바이스 배포의 지침에 따라 캐시 동작, 중지 작업 및 메모리 매핑 I/O(I/O) 속성을 설정하여 DDA용 VM을 준비합니다.
각 서버에 보안 완화 드라이버를 설치하고, GPU를 사용하지 않도록 설정한 다음, 호스트에서 분리하여 각 서버에서 GPU를 준비합니다. 이 프로세스 에 대한 자세한 내용은 개별 디바이스 할당을 사용하여 그래픽 디바이스 배포를 참조하세요.

참고 항목

GPU 지원을 통해 시스템이 Azure Stack HCI 솔루션을 지원해야 합니다. 옵션을 찾아보려면 Azure Stack HCI 카탈로그를 방문하세요.

클러스터 준비

필수 구성 요소가 완료되면 클러스터된 VM에서 GPU를 사용하도록 클러스터를 준비할 수 있습니다.

클러스터를 준비하려면 VM에 할당할 수 있는 GPU가 포함된 리소스 풀을 만들어야 합니다. 클러스터는 이 풀을 사용하여 GPU 리소스 풀에 할당된 시작 또는 이동된 VM에 대한 VM 배치를 결정합니다.

Windows Admin Center
PowerShell

Windows Admin Center를 사용하여 클러스터된 VM에서 GPU를 사용하도록 클러스터를 준비하려면 다음 단계를 수행합니다.

클러스터를 준비하고 GPU 리소스 풀에 VM을 할당하려면 다음을 수행합니다.

Windows Admin Center를 시작하고 GPU 확장이 이미 설치되어 있는지 확인합니다.
상단 드롭다운 메뉴에서 클러스터 관리자를 선택하고 클러스터에 연결합니다.
설정 메뉴에서 확장 GPU를>선택합니다.
도구 메뉴의 확장에서 GPU를 선택하여 도구를 엽니다.
도구의 기본 페이지에서 GPU 풀 탭을 선택한 다음, GPU 풀 만들기를 선택합니다.
새 GPU 풀 페이지에서 다음을 지정하고 저장을 선택합니다.
1. 서버 이름
2. GPU 풀 이름
3. 풀에 추가하려는 GPU
프로세스가 완료되면 새 GPU 풀 및 호스트 서버의 이름을 보여 주는 성공 프롬프트가 표시됩니다.

PowerShell을 사용하여 클러스터된 VM에서 GPU를 사용하도록 클러스터를 준비하려면 다음 단계를 수행합니다.

클러스터된 GPU 리소스를 포함하는 각 서버에 빈 리소스 풀을 새로 만듭니다. 각 서버에서 동일한 풀 이름을 제공해야 합니다.

PowerShell에서 관리자 권한으로 다음 cmdlet을 실행합니다.
```
 New-VMResourcePool -ResourcePoolType PciExpress -Name "GpuChildPool"
```
각 서버에서 분리된 GPU를 이전 단계에서 만든 리소스 풀에 추가합니다.

PowerShell에서 다음 명령을 실행합니다.
```
 $gpu = Get-VMHostAssignableDevice

 Add-VMHostAssignableDevice -HostAssignableDevice $gpu -ResourcePoolName "GpuChildPool"
```

이제 할당 가능한 GPU로 채워진 클러스터 전체 리소스 풀(명명 GpuChildPool됨)이 있습니다. 클러스터는 이 풀을 사용하여 GPU 리소스 풀에 할당된 시작 또는 이동된 VM에 대한 VM 배치를 결정합니다.

GPU 리소스 풀에 VM 할당

이제 GPU 리소스 풀에 VM을 할당할 수 있습니다. 클러스터된 GPU 리소스 풀에 하나 이상의 VM을 할당하고 클러스터된 GPU 리소스 풀에서 VM을 제거할 수 있습니다.

Windows Admin Center
PowerShell

Windows Admin Center를 사용하여 GPU 리소스 풀에 기존 VM을 할당하려면 다음 단계를 수행합니다.

참고 항목

또한 VM의 앱이 할당된 GPU를 활용할 수 있도록 VM 내에 GPU 제조업체의 드라이버를 설치해야 합니다.

GPU 풀에 VM 할당 페이지에서 다음을 지정한 다음 할당을 선택합니다.
1. 서버 이름
2. GPU 풀 이름
3. GPU 풀에서 GPU를 할당하려는 가상 머신 입니다.
메모리 매핑된 IO(IO) 공간에 대한 고급 설정 값을 정의하여 단일 GPU에 대한 리소스 요구 사항을 확인할 수도 있습니다.

프로세스가 완료되면 GPU 리소스 풀에서 VM으로 GPU를 성공적으로 할당했음을 보여 주는 확인 프롬프트가 표시됩니다. 그러면 할당된 VM 아래에 표시됩니다.

GPU 리소스 풀에서 VM을 할당 취소하려면 다음을 수행합니다.

GPU 풀 탭에서 할당 취소할 GPU를 선택한 다음, VM 할당 취소를 선택합니다.
GPU 풀의 할당 취소 VM 페이지의 가상 머신 목록 상자에서 VM의 이름을 지정한 다음 할당 취소를 선택합니다.

프로세스가 완료되면 VM이 GPU 풀에서 할당되지 않았고 할당 상태에서 GPU가 사용 가능(할당되지 않음)으로 표시됨이라는 성공 프롬프트가 표시됩니다.

PowerShell을 사용하여 GPU 리소스 풀에 기존 VM을 할당하려면 다음 단계를 수행합니다.

클러스터 VM 리소스의 기본 오프라인 작업을 force-shutdown 대신 구성합니다 save. GPU 리소스 풀에 할당하려는 VM의 이름으로 바꿔 <vmname> 야 합니다.

PowerShell에서 다음 cmdlet을 실행합니다.
```
 Get-ClusterResource -name <vmname> | Set-ClusterParameter -Name "OfflineAction" -Value 3
```
이전에 만든 리소스 풀을 VM에 할당합니다. 리소스 풀을 할당하면 VM이 시작되거나 이동될 때 VM에 풀에서 GpuChildPool 할당된 디바이스가 필요하다는 선언이 클러스터에 선언됩니다.

PowerShell에서 다음 cmdlet을 실행합니다.
```
 Get-ClusterResource -name <vmname> | Add-VMAssignableDevice -ResourcePoolName "GpuChildPool"
```
참고 항목

VM에 둘 이상의 GPU를 추가하려면 먼저 리소스 풀에 둘 이상의 할당 가능한 GPU를 사용할 수 있는지 확인한 다음 이전 명령을 다시 실행합니다.

VM에서 할당된 GPU를 제거할 수도 있습니다. 이렇게 하려면 PowerShell에서 다음 명령을 실행합니다. GPU 리소스 풀에 할당하려는 VM의 이름으로 바꿔 <vmname> 야 합니다.
```
 Add-VMAssignableDevice -VMName $vm -ResourcePoolName "GpuChildPool"

 $vm | Remove-VMAssignableDevice
```

VM을 시작하면 클러스터는 이 클러스터 전체 풀에서 사용 가능한 GPU 리소스가 있는 서버에 VM이 배치되도록 합니다. 또한 클러스터는 DDA를 통해 VM에 GPU를 할당하므로 VM 내의 워크로드에서 GPU에 액세스할 수 있습니다.

할당된 GPU를 사용하여 VM 장애 조치(failover)

GPU 워크로드를 사용할 수 있도록 클러스터의 기능을 테스트하려면 할당된 GPU를 사용하여 VM이 실행되는 서버에서 드레이닝 작업을 수행합니다. 서버를 드레이닝하려면 장애 조치(failover) 클러스터 유지 관리 절차의 지침을 따릅니다. 만든 풀에 다른 서버에 사용 가능한 GPU 리소스가 충분한 경우 클러스터의 다른 서버에서 VM을 다시 시작합니다.

클러스터된 VM에서 GPU를 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.

VM 및 GPU 분할에서 GPU를 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.

다음을 통해 공유

클러스터형 VM에서 GPU 사용

필수 조건

클러스터 준비

GPU 리소스 풀에 VM 할당

할당된 GPU를 사용하여 VM 장애 조치(failover)

피드백

추가 리소스

다음을 통해 공유

클러스터형 VM에서 GPU 사용

필수 조건

클러스터 준비

GPU 리소스 풀에 VM 할당

할당된 GPU를 사용하여 VM 장애 조치(failover)

관련 콘텐츠

피드백

추가 리소스