Windows를 실행하는 N 시리즈 VM의 NVIDIA GPU 드라이버 설치
적용 대상: ✔️ Linux VM ✔️ Windows VM ✔️ 유연한 확장 집합
NVIDIA GPU가 지원하는 Azure N 시리즈 VM의 GPU 기능을 활용하려면 NVIDIA GPU 드라이버를 설치해야 합니다. NVIDIA GPU 드라이버 확장은 N 시리즈 VM에 적절한 NVIDIA CUDA 또는 GRID 드라이버를 설치합니다. Azure PowerShell 또는 Azure Resource Manager 템플릿과 같은 도구나 Azure Portal을 사용하여 확장을 설치 또는 관리합니다. 지원되는 운영 체제 및 배포 단계는 NVIDIA GPU 드라이버 확장 설명서를 참조하세요.
NVIDIA GPU 드라이버를 수동으로 설치하려는 경우, 이 문서는 지원되는 운영 체제, 드라이버, 설치, 확인 단계를 제공합니다. Linux VM에 대한 드라이버 수동 설치 정보도 제공합니다.
기본 사양, 스토리지 용량 및 디스크 세부 정보는 GPU Windows VM 크기를 참조하세요.
지원되는 운영 체제 및 드라이버
NVIDIA Tesla(CUDA) 드라이버
참고 항목
Azure NVads A10 v5 VM은 vGPU 16.x(536.25) 이상 드라이버 버전만 지원합니다. A10 SKU용 vGPU 드라이버는 그래픽과 컴퓨팅 워크로드를 모두 지원하는 통합 드라이버입니다.
모든 NC* 및 ND 시리즈 VM용 NVIDIA Tesla(CUDA) 드라이버(NV 시리즈의 경우 선택 사항)는 일반적이며 Azure에만 국한되지 않습니다. 최신 드라이버에 대해서는 NVIDIA 웹 사이트를 참조하세요.
팁
Windows Server VM에서 수동 CUDA 드라이버를 설치하는 대신, Azure Data Science Virtual Machine 이미지를 배포할 수 있습니다. Windows Server 2016용 DSVM 에디션은 NVIDIA CUDA 드라이버, CUDA 심층 신경망 네트워크 라이브러리 및 기타 도구를 사전 설치합니다.
NVIDIA GRID/vGPU 드라이버
참고 항목
Azure NVads A10 v5 VM의 경우 고객은 항상 최신 드라이버 버전을 사용하는 것이 좋습니다. 최신 NVIDIA 주요 드라이버 분기(n)는 이전 주요 분기(n-1)하고만 역호환됩니다. 예를 들어, vGPU 17.x는 vGPU 16.x와만 이전 버전과 호환됩니다. 최신 드라이브 분기가 Azure에서 호스트에 롤아웃되면 여전히 2 이하에서 실행 중인 모든 VM에 드라이버 오류가 표시될 수 있습니다.
NVs_v3 VM은 vGPU 16 이하 드라이버 버전만 지원합니다.
Windows Server 2016 지원은 vGPU 17.x부터 제거됩니다.
Microsoft는 가상 워크스테이션 또는 가상 애플리케이션으로 사용되는 NV, NVv3, NVads A10 v5 시리즈 VM용 NVIDIA GRID 드라이버 설치 관리자를 재배포합니다. Azure NV 시리즈 VM에서 다음 표에 나열된 운영 체제에만 이러한 GRID 드라이버를 설치합니다. 이 드라이버에는 Azure의 GRID 가상 GPU 소프트웨어에 대한 라이선스가 포함됩니다. NVIDIA vGPU 소프트웨어 라이선스 서버를 설정할 필요가 없습니다.
Azure에서 재배포한 GRID 드라이버는 NCv2, NCv3, ND, NDv2 시리즈 VM과 같은 NV 이외의 시리즈 VM에서는 작동하지 않습니다. 한 가지 예외는 GRID 드라이버가 NV 시리즈와 유사한 그래픽 기능을 활성화하는 NCas_T4_V3 VM 시리즈입니다.
Nvidia 확장은 항상 최신 드라이버를 설치합니다.
Windows 11(23H2 이하), Windows 10(22H2 이하), Server 2019/2022의 경우:
- GRID 17.3(552.74) (.exe)
이전 버전에 대한 다음 링크는 이전 드라이버 버전에 대한 종속성을 지원하기 위해 제공됩니다.
Windows Server 2016 1607, 1709의 경우:
- GRID 14.1(512.78)(.exe)은 NVIDIA에서 마지막으로 지원되는 드라이버입니다. 최신 15.x 이상 버전은 Windows Server 2016을 지원하지 않습니다.
Windows Server 2012 R2의 경우:
- GRID 13.1(472.39)(.exe)
- GRID 13(471.68)(.exe)
모든 이전 Nvidia GRID 드라이버 버전에 대한 링크를 보려면 GitHub를 방문하세요.
드라이버 설치
각 N 시리즈 VM에 원격 데스크톱으로 연결합니다.
Windows 운영 체제에 지원되는 드라이버를 다운로드, 추출 및 설치합니다.
VM에서는 GRID 드라이버 설치 후 다시 시작해야 합니다. CUDA 드라이버 설치 후에는 다시 시작할 필요가 없습니다.
드라이버 설치 확인
Nvidia 제어판은 GRID 드라이버를 설치해야만 액세스할 수 있다는 점에 유의하세요. CUDA 드라이버를 설치한 경우에는 Nvidia 제어판이 보이지 않습니다.
디바이스 관리자에서 드라이버 설치를 확인할 수 있습니다. 다음 예제에서는 Azure NC VM에서 Tesla K80 카드의 성공적인 구성을 보여 줍니다.
GPU 디바이스 상태를 쿼리하려면 드라이버와 함께 설치된 명령줄 유틸리티인 nvidia-smi를 실행합니다.
명령 프롬프트를 열고 C:\Program Files\NVIDIA Corporation\NVSMI 디렉터리로 변경합니다.
nvidia-smi
를 실행합니다. 드라이버가 설치된 경우 다음과 유사한 출력이 표시됩니다. 현재 VM에서 GPU 작업을 실행 중이지 않으면 GPU-Util에 0%가 표시됩니다. 드라이버 버전 및 GPU 세부 정보는 표시된 것과 다를 수 있습니다.
RDMA 네트워크 연결
동일한 가용성 집합 또는 가상 머신 확장 집합의 단일 배치 그룹에 배포된 NC24r과 같은 RDMA 지원 N 시리즈 VM에서 RDMA 네트워크 연결을 사용할 수 있습니다. RDMA 연결에 필요한 Windows 네트워크 디바이스 드라이버를 설치하는 HpcVmDrivers 확장을 추가해야 합니다. RDMA 지원 N 시리즈에 VM 확장을 추가하려면 Azure Resource Manager용 Azure PowerShell cmdlet을 사용합니다.
미국 서부 하위 지역에서 이름이 myVM인 기존 RDMA 지원 VM에 최신 버전 1.1 HpcVMDrivers 확장을 설치하려면
Set-AzVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "HpcVmDrivers" -Publisher "Microsoft.HpcCompute" -Type "HpcVmDrivers" -TypeHandlerVersion "1.1"
자세한 내용은 Windows용 가상 머신 확장 및 기능을 참조하세요.
RDMA 네트워크는 Microsoft MPI 또는 Intel MPI 5.x를 사용하여 실행되는 애플리케이션에 대한 MPI(Message Passing Interface) 트래픽을 지원합니다.
다음 단계
- NVIDIA Tesla GPU에 대한 GPU 가속 애플리케이션을 빌드하는 개발자는 최신 CUDA Toolkit을 다운로드하여 설치할 수도 있습니다. 자세한 내용은 CUDA 설치 가이드를 참조하세요.