Série NCads H100 v5
S’applique aux : ✔️ Machines virtuelles Linux ✔️ Machines virtuelles Windows ✔️ Groupes identiques flexibles ✔️ Groupes identiques uniformes
Les machines virtuelles de série NCads H100 v5 sont une nouveauté de la famille de GPU Azure. Vous pouvez utiliser cette série pour des charges de travail réelles d’inférence par lots et d’entraînement Azure Applied AI. Les séries des machines virtuelles NCads H100 v5 sont alimentées par GPU NVIDIA H100 NVL et les processeurs Genoa AMD EPYC™ de 4e génération. Les machines virtuelles ont jusqu’à 2 GPU NVIDIA H100 NVL avec 94 Go de mémoire chacun, jusqu’à 96 cœurs de processeur AMD EPYC Genoa non-multithread et 640 Gio de mémoire système. Ces machines virtuelles sont idéales pour les charges de travail réelles Applied AI, par exemple :
- Analytique et bases de données avec performances de processeur graphiques accélérées
- Inférence par lots avec un traitement lourd avant et après
- Entraînement du modèle d’autonomie
- Simulation de réservoir de pétrole et de gaz
- Développement de machine learning (ML)
- Traitement vidéo
- Services web IA/ML
Fonctionnalités prises en charge
Pour démarrer avec les machines virtuelles NCads H100 v5, reportez-vous à Configuration et optimisation des charges de travail HPC pour les étapes comprenant la configuration des pilotes et du réseau.
En raison de l'encombrement accru des E/S de la mémoire GPU, le NCads H100 v5 nécessite l'utilisation de machines virtuelles de génération 2 et d'images de marché. Pour plus d’informations sur la configuration, suivez les instructions relatives aux images Azure HPC.
- Stockage Premium : Pris(e) en charge
- Mise en cache du Stockage Premium : Pris(e) en charge
- Disques Ultra : non pris en charge
- Migration dynamique : Non pris en charge
- Mises à jour avec préservation de la mémoire : Non pris en charge
- Génération de machine virtuelle prise en charge : Génération 2
- Performances réseau accélérées : Pris en charge
- Disques de système d’exploitation éphémères : Pris en charge
- InfiniBand : Non pris en charge
- Interconnexion NVIDIA/NVLink : Pris en charge
- Virtualisation imbriquée : non pris en charge
Taille | Processeurs virtuels | Mémoire (Gio) | Disque temporaire NVMe (Gio) | GPU | Mémoire GPU (Gio) | Disques de données max. | Débit de disque maximal sans mise en cache (IOPS / Mbits/s) | Cartes réseau/bande passante réseau max. (Mo/s) |
---|---|---|---|---|---|---|---|---|
Standard_NC40ads_H100_v5 | 40 | 320 | 3576 | 1 | 94 | 8 | 100000/3000 | 2/40 000 |
Standard_NC80adis_H100_v5 | 80 | 640 | 7 152 | 2 | 188 | 16 | 240000/7000 | 4/80 000 |
1 1 GPU = une carte H100
2 Les disques NVMe locaux sont éphémères. Les données sont perdues sur ces disques si vous arrêtez ou désallouez votre machine virtuelle. Les disques NVMe ne sont pas chiffrés par le chiffrement du stockage Azure, même si vous activez le chiffrement sur l’hôte.
Définitions des tailles de tables
La capacité de stockage est indiquée en unités de Gio ou 1 024^3 octets. Lorsque vous comparez des disques mesurés en Go (1 000^3 octets) à des disques mesurés en Gio (1 024^3), n’oubliez pas que les nombres de capacité donnés en Gio peuvent paraitre inférieurs. Par exemple, 1 023 Gio = 1 098,4 Go.
Le débit de disque est mesuré en opérations d’entrée/sortie par seconde (IOPS) et Mbit/s où Mbit/s = 10^6 octets par seconde.
Les disques de données peuvent fonctionner en mode avec ou sans mise en cache. En cas de fonctionnement du disque de données avec mise en cache, le mode de mise en cache hôte est défini sur ReadOnly ou ReadWrite. En cas de fonctionnement du disque de données sans mise en cache, le mode de mise en cache hôte est défini sur Aucun.
Pour découvrir comment obtenir les meilleures performances de stockage pour vos machines virtuelles, consultez Performances des disques et des machines virtuelles.
La bande passante réseau attendue est la bande passante agrégée maximale qui est allouée par type de machine virtuelle entre toutes les cartes réseau, pour toutes les destinations. Pour plus d’informations, consultez Bande passante réseau des machines virtuelles.
Les limites supérieures ne sont pas garanties. Les limites permettent de sélectionner le type de machine virtuelle approprié pour l’application prévue. Les performances réseau réelles dépendent de nombreux facteurs, notamment la congestion du réseau, les charges de l’application, ainsi que les paramètres réseau. Pour plus d’informations sur l’optimisation du débit du réseau, consultez Optimiser le débit du réseau pour les machines virtuelles Azure. Pour atteindre la performance réseau attendue sous Linux ou Windows, il peut être nécessaire de sélectionner une version spécifique ou d’optimiser votre machine virtuelle. Pour plus d’informations, consultez Test de bande passante/débit (NTTTCP).
Autres tailles et informations
- Usage général
- Mémoire optimisée
- Optimisé pour le stockage
- Optimisé pour le GPU
- Calcul haute performance
- Générations précédentes
Vous pouvez utiliser la calculatrice de prix pour estimer les coûts de vos machines virtuelles Azure.
Pour plus d’informations sur les types de disques, consultez Quels sont les types de disque disponibles dans Azure ?