가상 머신에 GPU 분할 및 할당
적용 대상: Azure Stack HCI, 버전 23H2 및 22H2
참고 항목
Azure Stack HCI 23H2에서 VM을 만들고 관리하는 권장 방법은 Azure Arc 컨트롤 플레인을 사용하는 것입니다. Azure Arc VM에서 사용할 수 없는 기능이 필요한 경우에만 아래에 설명된 메커니즘을 사용하여 VM을 관리합니다.
이 문서에서는 GPU(Graphics Processing Unit) 파티션을 구성하고 VM(Virtual Machine)에 파티션을 할당하는 방법을 설명합니다. Windows Admin Center 및 PowerShell을 통해 GPU 파티션 수를 구성하고, GPU 파티션을 할당하고, GPU 파티션을 할당하지 않는 방법에 대한 지침을 제공합니다.
GPU 분할 기능을 프로비전하려면 다음 단계를 완료해야 합니다.
- 모든 필수 구성 요소을 완료합니다.
- GPU 드라이버 설치를 확인합니다.
- 파티션 수를 구성합니다.
- VM에 GPU 파티션을 할당합니다.
- 필요한 경우 VM에서 GPU 파티션을 할당 취소합니다.
필수 조건
GPU 분할 기능을 사용하기 전에 고려해야 할 몇 가지 요구 사항과 사항이 있습니다.
호스트 서버의 필수 구성 요소
호스트 서버에 Windows Server 2025가 설치되어 있어야 합니다. 가상 머신 호스트를 실시간 마이그레이션할 때 클러스터링이 필요한 경우 Windows Server 2025 Datacenter를 설치해야 합니다.
서버에 설치되고 구성된 Hyper-V 역할입니다. 응시하는 방법을 알아보려면 Windows Server에 Hyper-V 역할 설치를 참조하세요.
- 클러스터의 모든 서버에 Azure Stack HCI를 설치합니다. Azure Stack HCI 운영 체제 배포를 참조하세요.
클러스터의 모든 서버에 동일한 제조업체, 모델 및 크기의 물리적 GPU 디바이스를 설치합니다. 클러스터의 물리적 서버에 GPU 디바이스를 설치할 때 OEM 제공 설명서를 참조하세요.
GPU IHV의 지침에 따라 클러스터의 모든 서버에 GPU 드라이버를 설치합니다. NVIDIA GPU 드라이버의 경우 NVIDIA vGPU 설명서를 참조하세요.
클러스터에 있는 각 서버의 BIOS에서 가상화 지원 및 SR-IOV가 사용하도록 설정되어 있는지 확인합니다. BIOS에서 올바른 설정을 식별할 수 없는 경우 시스템 공급업체에 문의하세요.
- 클러스터 호스트에는 IOMMU(Input/Output Memory Management Unit) DMA 비트 추적 가능 프로세서가 있어야 합니다. 예를 들어 Intel VT-D 또는 AMD-Vi를 지원하는 프로세서입니다.
참고 항목
GPU 파티션이 할당된 가상 머신을 실시간 마이그레이션하는 경우 Hyper-V 라이브 마이그레이션은 자동으로 압축과 함께 TCP/IP를 사용하는 것으로 돌아갑니다. 이로 인해 호스트의 CPU 사용률이 증가할 가능성이 있습니다. 또한 GPU 파티션이 연결되지 않은 가상 머신보다 실시간 마이그레이션이 더 오래 걸릴 수 있습니다.
VM에 대한 필수 구성 요소
지원되는 게스트 운영 체제 목록에서 게스트 운영 체제를 사용하여 VM을 배포합니다.
GPU IHV의 지침에 따라 VM에 GPU 드라이버를 설치합니다. NVIDIA GPU 드라이버의 경우 NVIDIA vGPU 설명서를 참조하세요.
Windows Admin Center의 필수 구성 요소
Windows Admin Center를 사용하여 GPU 분할을 프로비전하는 경우 GPU 확장 버전 2.8.0 이상을 사용하여 최신 버전의 Windows Admin Center를 설치해야 합니다. Windows Admin Center에서 GPU 확장을 설치하는 방법에 대한 지침은 확장 설치를 참조하세요.
확장을 설치한 후 다음 스크린샷과 같이 설치된 확장 탭 아래에 표시됩니다. GPU 확장의 버전이 2.8.0 이상인지 확인합니다.
PowerShell을 위한 전제 조건
PowerShell을 사용하여 GPU 분할을 프로비전하는 경우 모든 PowerShell 명령을 관리자 사용자로 실행해야 합니다.
GPU 분할에 PowerShell 명령을 사용하는 방법에 대한 자세한 내용은 Add-VMGpuPartitionAdapter, Get-VMGpuPartitionAdapter 및 Remove-VMGpuPartitionAdapter 참조 설명서를 참조하세요.
GPU 드라이버 설치 확인
모든 필수 구성 요소를 완료한 후에는 GPU 드라이버가 설치되고 분할 가능한지 확인해야 합니다.
다음 단계에 따라 WINDOWS Admin Center를 사용하여 GPU 드라이버가 설치되고 분할할 수 있는지 확인합니다.
Windows Admin Center를 시작하고 GPU 확장이 이미 설치되어 있는지 확인합니다.
상단 드롭다운 메뉴에서 클러스터 관리자 를 선택하고 클러스터에 연결합니다.
설정 메뉴에서, GPU 확장>을 선택합니다.
GPU 페이지의 GPU 탭에는 각 서버에 설치된 모든 서버 및 실제 GPU의 인벤토리가 표시됩니다.
모든 서버에 대해 각 GPU에 대해 할당된 상태 열을 확인합니다. 할당된 상태 열은 다음 상태 중 하나를 가질 수 있습니다.
할당된 상태 열이 클러스터의 모든 서버에서 GPU에 대해 분할됨으로 표시되는 경우에만 GPU 분할 워크플로에서 더 진행합니다.
GPU 파티션 수 구성
각 분할 가능한 GPU에는 OEM으로 미리 정의된 유효한 파티션 수 집합이 함께 제공됩니다. GPU가 가질 수 있는 파티션 수는 정의할 수 없습니다. 그러나 지원되는 집합 내에서 유효한 개수로 파티션 수를 구성할 수 있습니다.
Windows Admin Center를 통해 파티션 수를 구성하려면 다음 단계를 수행합니다.
GPU 파티션 탭을 선택하여 파티션 수를 구성합니다. 이 탭을 사용하여 VM에 파티션을 할당하고 VM에서 파티션을 할당 취소할 수도 있습니다.
참고 항목
클러스터에서 사용할 수 있는 분할 가능한 GPU가 없거나 올바른 GPU 분할 드라이버가 설치되어 있지 않으면 GPU 파티션 탭에 다음 메시지가 표시됩니다.
분할 가능한 GPU를 찾을 수 없습니다. 계속 진행하려면 올바른 GPU-P 드라이버가 있는 GPU가 있는지 확인하세요.
GPU 또는 GPU 파티션을 선택하여 선택한 항목 세부 정보에서 페이지의 아래쪽 섹션에 세부 정보를 표시합니다. 예를 들어 GPU를 선택하면 GPU 이름, GPU ID, 사용 가능한 인코더 및 디코더, 사용 가능한 VRAM, 유효한 파티션 수 및 현재 파티션 수가 표시됩니다. GPU 파티션을 선택하면 파티션 ID, VM ID, 인스턴스 경로, 파티션 VRAM, 파티션 인코딩 및 파티션 디코딩이 표시됩니다.
파티션 수 구성을 선택합니다.
GPU 페이지의 파티션 개수 구성이 표시됩니다. 각 서버에 대해 설치된 GPU 디바이스를 표시합니다.
같은 유형의 GPU 집합을 선택합니다. 같은 유형의 GPU 집합은 동일한 크기, 제조업체, 모델 번호 및 파티션 수의 GPU가 있는 GPU입니다. 기본적으로 Windows Admin Center는 다음 스크린샷과 같이 동일한 GPU 집합을 감지하는 경우 자동으로 선택합니다.
선택한 항목에 따라 경고 또는 오류가 표시될 수 있습니다.
경고. 같은 유형의 GPU 집합에서 하나 이상의 GPU를 선택 취소하면 Windows Admin Center에서 경고가 표시되지만 더 이상 진행되지는 않습니다. 경고 텍스트는 모든 GPU를 선택하지 않음을 나타내며 다른 파티션 수가 발생할 수 있으므로 권장되지 않습니다.
경고. 모든 서버의 모든 GPU가 동일한 구성을 가지고 있지 않은 경우 Windows Admin Center에서 경고를 제공합니다. 추가 작업을 진행하려면 동일한 구성으로 GPU를 수동으로 선택해야 합니다.
오류. 구성이 다른 GPU를 선택하면 Windows Admin Center에서 오류가 발생하며 계속 진행할 수 없습니다.
오류. VM에 이미 할당된 GPU 파티션을 선택하면 Windows Admin Center에서 오류가 발생하며 계속 진행할 수 없습니다. 계속 진행하기 전에 먼저 VM에서 파티션을 할당 취소해야 합니다. VM에서 파티션 할당 취소를 참조하세요.
같은 유형의 GPU 집합을 선택한 후 파티션 수 드롭다운 목록에서 파티션 수를 선택합니다. 이 목록은 GPU 제조업체에서 구성한 파티션 수를 자동으로 채웁니다. 목록에 표시되는 개수는 선택한 GPU 유형에 따라 달라질 수 있습니다.
다른 파티션 수를 선택하는 즉시 도구 설명이 드롭다운 목록 아래에 표시되며 각 파티션이 가져오는 VRAM의 크기를 동적으로 표시합니다. 예를 들어 GPU의 16개 파티션에 대해 총 VRAM이 16GB인 경우 파티션 수를 16에서 8로 변경하면 각 파티션에 1.85GB의 VRAM이 할당됩니다.
파티션 수 구성을 선택합니다.
파티션 수를 구성한 후 Windows Admin Center는 파티션 수가 성공적으로 구성되었음을 알리고 GPU 파티션 탭을 다시 표시합니다. 파티션 수 열 아래에서 GPU 파티션에 대한 새 파티션 수를 볼 수 있습니다.
VM에 GPU 파티션을 할당합니다
VM에 파티션을 할당하기 전에 워크로드를 저장합니다.
참고 항목
현재 VM에 단일 GPU 파티션만 할당할 수 있습니다. VM과 GPU 파티션은 모두 동일한 호스트 컴퓨터에 있어야 합니다. 워크로드 성능 요구 사항에 따라 미리 계획하고 GPU 파티션 크기를 결정하는 것이 좋습니다.
파티션을 할당하기 전에 워크로드를 저장해야 합니다. VM이 현재 켜져 있거나 실행 중인 경우 Windows Admin Center는 자동으로 VM을 해제하고 파티션을 할당한 다음 자동으로 켭니다.
GPU 파티션 탭에서 + 파티션 할당을 선택합니다.
VM에 GPU 파티션 할당 페이지가 표시됩니다.
서버 선택 목록에서 VM이 있는 서버를 선택합니다. 이 목록에는 클러스터의 모든 서버가 표시됩니다.
GPU 파티션을 할당할 VM을 검색하고 선택합니다. 목록은 2단계에서 선택한 서버에 있는 VM을 자동으로 채웁니다.
GPU 파티션이 이미 VM에 할당된 경우 해당 VM은 회색으로 표시됩니다.
모두 선택 확인란을 선택하여 모든 VM을 한 번에 선택합니다.
사용 가능한 VRAM 옵션을 선택합니다. 이 필드의 값은 구성한 파티션 수의 크기와 일치해야 합니다.
(선택 사항이지만 권장) VM을 고가용성으로 사용하고 호스트 서버가 중단되어 장애 조치(failover)하려면 강제 종료에 대한 오프라인 작업 구성 확인란을 선택합니다.
파티션 할당을 선택합니다. 선택한 VRAM 크기의 파티션을 선택한 호스트 서버의 선택한 VM에 할당합니다.
파티션이 할당된 후 Windows Admin Center는 파티션이 성공적으로 할당되었음을 알리고 GPU 파티션 탭을 다시 표시합니다. GPU 파티션 탭에서 VM은 설치된 서버의 GPU 파티션 행에 표시됩니다.
VM에서 파티션 할당 취소
워크로드를 실행하는 데 더 이상 필요하지 않은 경우 VM에서 GPU 파티션을 할당 해제할 수 있습니다. 파티션을 할당 취소하면 GPU 파티션 리소스가 해제되므로 나중에 다른 VM에 다시 할당할 수 있습니다.
파티션을 할당 해제하기 전에 워크로드를 저장해야 합니다.
VM이 현재 켜져 있거나 실행 중인 경우, Windows Admin Center는 먼저 자동으로 VM을 해제하고 파티션을 할당 해제한 다음 자동으로 켭니다.
VM에서 파티션을 할당 해제하려면 다음 단계를 수행합니다.
GPU 파티션 탭에서 할당 취소할 GPU 파티션을 선택합니다.
- 파티션 할당 해제를 선택합니다.
VM 페이지의 GPU 파티션 할당 해제가 표시됩니다.
서버 선택 목록에서 할당 해제할 GPU 파티션이 있는 서버를 선택합니다.
목록에서 가상 머신을 선택하여 파티션 할당을 해제하거나, VM을 검색하거나 선택하여 파티션을 할당 해제합니다.
파티션 할당 해제를 선택합니다.
파티션이 할당 해제된 후 Windows Admin Center는 파티션이 성공적으로 할당 해제되었음을 알리고 GPU 파티션 탭을 다시 표시합니다. GPU 파티션 탭에서 파티션이 할당되지 않은 VM은 더 이상 GPU 파티션 행에 표시되지 않습니다.