Machines virtuelles GPU pour les appareils Azure Stack Edge Pro GPU

Article
11/05/2024

S’APPLIQUE À : Yes for Pro - Référence SKU GPU Azure Stack Edge Pro – GPU Oui pour la référence SKU Pro 2 Azure Stack Edge Pro 2Azure Stack Edge Pro R

Les charges de travail accélérées par GPU sur un appareil Azure Stack Edge Pro GPU requièrent une machine virtuelle GPU. Cet article fournit une vue d’ensemble des machines virtuelles GPU, y compris les systèmes d’exploitation pris en charge, les pilotes GPU et les tailles de machine virtuelle. Les options de déploiement des machines virtuelles GPU utilisées avec les clusters Kubernetes sont également abordées.

À propos des machines virtuelles GPU

Vos appareils Azure Stack Edge peuvent être équipés de 1 ou 2 GPU Tesla T4 ou Tensor Core A2 de NVIDIA. Pour déployer des charges de travail de machine virtuelle avec accélération GPU sur ces appareils, utilisez des tailles de machine virtuelle optimisées pour le GPU. La machine virtuelle GPU choisie doit correspondre à la réalisation du GPU sur votre appareil Azure Stack Edge. Pour plus d’informations, consultez Machines virtuelles optimisées par le GPU de la série N prises en charge.

Pour tirer parti des fonctionnalités GPU de machines virtuelles de la série N Azure, installez des pilotes GPU NVIDIA. L’extension du pilote GPU NVIDIA installe les pilotes NVIDIA CUDA ou GRID appropriés. Vous pouvez installer les extensions GPU à l’aide de modèles ou via le portail Azure.

Vous pouvez installer et gérer l’extension à l’aide des modèles Azure Resource Manager après le déploiement des VM. Dans le Portail Azure, vous pouvez installer l’extension GPU pendant ou après le déploiement d’une machine virtuelle. pour obtenir des instructions, consultez Déployer des machines virtuelles GPU sur votre appareil Azure Stack Edge.

Si un cluster Kubernetes est configuré sur votre appareil, veillez à passer en revue les considérations relatives au déploiement pour les clusters Kubernetes avant de déployer les machines virtuelles GPU.

Pilotes GPU et systèmes d’exploitation pris en charge

Les extensions du pilote GPU NVIDIA pour Windows et Linux prennent en charge les versions de système d’exploitation suivantes.

Systèmes d’exploitation pris en charge pour l’extension GPU pour Windows

Cette extension prend en charge les systèmes d’exploitation suivants. D’autres versions peuvent fonctionner, mais elles n’ont pas été testées en interne sur des machines virtuelles GPU exécutées sur des appareils Azure Stack Edge.

Distribution	Version
Windows Server 2019	Core
Windows Server 2016	Core

Systèmes d’exploitation pris en charge pour l’extension GPU pour Linux

Cette extension prend en charge la distribution suivante de système d’exploitation, en fonction de la prise en charge par le pilote de la version spécifique du système d’exploitation. D’autres versions peuvent fonctionner, mais elles n’ont pas été testées en interne sur des machines virtuelles GPU exécutées sur des appareils Azure Stack Edge.

Distribution	Version
Red Hat Enterprise Linux	7.4

Remarque

Ubuntu 18.04 LTS L’extension GPU est obsolète. L’extension GPU n’est plus prise en charge sur les machines virtuelles GPU Ubuntu 18.04 s’exécutant sur des appareils Azure Stack Edge. Si vous envisagez d’utiliser la distribution Ubuntu version 18.04 LTS, consultez les étapes d’installation manuelle du pilote GPU sur Téléchargements du kit de ressources CUDA 12.1 Update 1. Vous devrez peut-être télécharger la clé de signature CUDA avant l’installation. Pour un exemple d’installation de la clé de signature, voir Dépannage des problèmes d’extension GPU pour les VM GPU sur Azure Stack Edge Pro GPU.

Déploiement de machine virtuelle GPU

Vous pouvez déployer une machine virtuelle GPU par le biais du portail Azure ou en utilisant des modèles Azure Resource Manager. L’extension GPU est installée après la création de la machine virtuelle.

Portail : Dans le portail Azure, vous pouvez installer rapidement l’extension GPU lorsque vous créez une machine virtuelle ou après un déploiement de machine virtuelle.
Modèles : À l’aide de modèles Azure Resource Manager, vous créez une machine virtuelle, puis vous installez l’extension GPU.

Machines virtuelles GPU et Kubernetes

Avant de déployer des machines virtuelles GPU sur votre appareil, passez en revue les considérations suivantes si Kubernetes est configuré sur l’appareil.

Pour un appareil avec un GPU :

Créer une machine virtuelle GPU suivie de la configuration Kubernetes sur votre appareil : dans ce scénario, la création de la machine virtuelle GPU et la configuration Kubernetes réussissent. Dans ce cas, Kubernetes n’a pas accès au GPU.
Configurer Kubernetes sur votre appareil suivi de la création d’une VM GPU : Dans ce scénario, Kubernetes réclame le GPU sur votre appareil et la création de la VM échouera car il n’y a pas de ressources GPU disponibles.

Pour un appareil avec deux GPU :

Créer une VM GPU suivie d’une configuration Kubernetes sur votre appareil : Dans ce scénario, la VM GPU que vous créez revendiquera un GPU sur votre appareil et la configuration Kubernetes sera également réussie et revendiquera le GPU restant.
Créer deux VM GPU suivies d’une configuration Kubernetes sur votre appareil : Dans ce scénario, les deux VM GPU revendiquent les deux GPU sur l’appareil et Kubernetes est configuré avec succès sans GPU.
Configurer Kubernetes sur votre appareil suivi de la création d’une VM GPU : Dans ce scénario, Kubernetes réclame à la fois les GPU sur votre appareil et la création de la VM échouera car aucune ressource GPU n’est disponible.

Étapes suivantes

Découvrez comment Déployer des VM GPU.
Découvrez comment Installer l’extension GPU sur les machines virtuelles GPU exécutées sur votre appareil.

Partager via