Azure Stack HCI VM의 GPU 지원 구성

완료됨

Contoso의 Linux 기반 재무 모델링 애플리케이션 중 일부는 강력한 컴퓨팅 리소스가 필요합니다. 현재 이러한 애플리케이션은 수명 종료가 다가오는 타사 하드웨어에 의존하고 있습니다. Azure Stack HCI의 GPU 지원으로 레거시 하드웨어를 대체할 수 있는지 확인하고 싶습니다.

Azure Stack HCI 시나리오에서 GPU의 이점은 무엇인가요?

GPU는 기존 CPU가 제공할 수 있는 것보다 훨씬 큰 처리 능력이 필요한 특수 워크로드에 최적화된 특수 전자 회로입니다. GPU는 가속을 통해 CPU를 보완하고 컴퓨팅을 가장 많이 사용하는 작업을 처리합니다. GPU 가속을 활용하는 워크로드 일부는 다음과 같습니다.

  • VDI 및 DaaS(Desktop-as-a-Service) 시나리오를 포함한 앱 및 데스크톱 원격
  • 원격 렌더링, 인코딩, 시각화
  • 재무 모델링 시나리오에서 일반적인 HPC(고성능 컴퓨팅) 및 ML(기계 학습)

GPU는 가상화된 워크로드에 GPU를 사용하는 데 도움이 되는 가상화를 지원합니다. Azure Stack HCI에서는 DDA(Discrete Device Assignment)를 사용하여 이러한 가상화를 구현할 수 있습니다. DDA를 사용하면 Windows 또는 Linux 운영 체제를 실행하는 VM에 하나 이상의 실제 GPU를 할당할 수 있습니다.

참고

DDA를 사용하면 실제 GPU가 단일 VM에만 가속을 제공합니다. 다중 사용자 환경에서 DDA 이점을 최대화하려면 VM당 여러 특수 워크로드를 호스트하는 것이 좋습니다. RDS(원격 데스크톱 서비스)를 구현하면 Windows Server의 다중 세션 기능을 사용하여 동일한 VM에서 여러 사용자 세션을 호스트할 수 있습니다. 이러한 각 세션은 GPU 가속을 효과적으로 활용할 수 있습니다.

Azure Stack HCI VM의 GPU 가속 구성

Azure Stack HCI VM에서 DDA 기반 GPU 가속을 구성하는 프로세스는 다음과 같은 네 가지 주요 작업으로 구성됩니다.

  1. DDA를 위해 VM을 구성합니다.
  2. 클러스터 노드에서 GPU를 분리합니다.
  3. 디바이스를 VM에 할당합니다.
  4. 게스트 운영 체제에 GPU 드라이버를 설치합니다.

참고

DDA는 Hyper-V 호스트의 실제 GPU를 VM에 연결하므로 Azure Stack HCI 시나리오에서 장애 조치(failover)를 지원하지 않습니다. 실제로 항상 사용 가능한 클러스터 역할이 아닌 독립 실행형으로 VM을 프로비전해야 합니다. Windows Admin Center를 사용하여 이러한 VM을 만드는 경우 클러스터가 아니라 대상 클러스터 노드에 VM을 연결해야 합니다.

DDA를 위해 VM 구성

DDA를 사용하려면 다음을 비롯한 몇 가지 VM 수준 구성 변경이 필요합니다.

  • 대상 VM의 자동 중지 작업가상 머신 끄기로 설정.
  • 실제 GPU와 대상 VM 간의 통신을 활성화하고 최적화하는 값을 할당.

이러한 모든 작업은 대상 VM을 호스트하는 클러스터 노드에서 실행되는 Windows PowerShell을 사용하여 수행할 수 있습니다. 자동 중지 작업 설정은 Windows Admin Center에서도 구성할 수 있습니다.

클러스터 노드에서 GPU 분리

GPU는 VM에만 사용되므로 GPU를 비활성화하고 클러스터 노드에서 분리해야 합니다. 먼저 GPU 디바이스의 PCI 위치 경로를 파악해야 합니다. Windows 디바이스 관리자를 사용하여 해당 값을 검색하고 디바이스를 비활성화할 수 있습니다. 디바이스를 분리하려면 대상 VM을 호스트하는 클러스터 노드에서 Dismount-VMHostAssignableDevice PowerShell cmdlet을 실행하고 디바이스 위치 경로를 참조합니다.

디바이스를 VM에 할당

클러스터 노드에서 디바이스가 분리되면 이제 대상 VM에 디바이스를 할당할 수 있습니다. 이 작업을 수행하기 위해 대상 VM을 호스트하는 클러스터 노드에서 실행되는 Windows PowerShell을 사용할 수도 있습니다.

게스트 운영 체제에 GPU 드라이버 설치

디바이스가 대상 VM에 성공적으로 할당된 후 디바이스를 온라인 상태로 만들고 해당 운영 체제 내에 GPU 하드웨어 관련 드라이버를 설치할 수 있습니다. 결과를 확인하려면 Windows의 디바이스 관리자 또는 Linux의 lspci 유틸리티를 사용합니다.

지식 점검

1.

Azure Stack HCI에서 실행되는 Linux VM을 사용하여 Contoso의 재무 애플리케이션 사용을 평가하려고 합니다. Azure Stack HCI 클러스터 하드웨어에는 NVIDIA GPU가 포함되어 있습니다. NVIDIA GPU를 Linux VM에 할당하기 전에 수행해야 하는 작업은 무엇인가요? 솔루션은 구성 변경 수를 최소화해야 합니다.