La macchina virtuale (VM) serie ND v5 H200 è progettata per offrire prestazioni eccezionali per i carichi di lavoro HPC (Ai e High Performance Computing). Queste macchine virtuali sfruttano la potenza della GPU NVIDIA H200 Tensor Core, che offre un aumento del 76% della memoria a larghezza di banda elevata rispetto alle GPU H100 per offrire prestazioni più elevate sui modelli generativi all'avanguardia. Con 141 GB di memoria ad alta velocità e 4,8 TB/s di larghezza di banda di memoria, la GPU H200 può gestire set di dati più grandi e modelli più complessi, rendendolo ideale per l'intelligenza artificiale generativa e il calcolo scientifico.
La serie ND H200 v5 inizia con una singola macchina virtuale e otto GPU NVIDIA H200 Tensor Core interconnesse con 900 GB/s NVLink. Le distribuzioni basate su ND H200 v5 possono aumentare fino a migliaia di GPU con 3,2 Tb/s di larghezza di banda di interconnessione per macchina virtuale. Ogni GPU all'interno della macchina virtuale viene fornita con una propria connessione InfiniBand dedicata e indipendente dalla topologia 400 Gb/s NVIDIA Quantum-2 CX7. Queste connessioni vengono configurate automaticamente tra le macchine virtuali che occupano lo stesso set di scalabilità di macchine virtuali e supportano GPUDirect RDMA.
Queste istanze offrono prestazioni eccellenti per molti strumenti di intelligenza artificiale, MACHINE learning e analisi che supportano l'accelerazione GPU "predefinita", ad esempio TensorFlow, Pytorch, Caffe, RAPIDS e altri framework. Inoltre, l'interconnessione InfiniBand scale-out è supportata da un ampio set di strumenti di intelligenza artificiale e HPC esistenti, basati sulle librerie di comunicazione NCCL di NVIDIA per un clustering semplice della GPU.
Specifiche dell'host
In parte |
Quantità
Conteggio delle unità |
Specifiche
ID SKU, unità delle prestazioni e così via. |
Processore |
96 vCPU |
Intel Xeon (Zaffiro Rapids) [x86-64] |
Memoria |
1850 GiB |
|
Archiviazione locale |
1 disco |
28000 GiB |
Archiviazione remota |
16Disks |
|
Rete |
8 schede di interfaccia di rete |
|
Acceleratori |
8 GPU |
GPU Nvidia H200 (141 GB) |
Supporto funzionalità
Archiviazione Premium: supportata
Memorizzazione nella cache Archiviazione Premium: supportata
Live Migration: non supportato
Aggiornamenti con mantenimento della memoria: non supportati
Macchine virtuali di seconda generazione: supportate
Macchine virtuali di prima generazione: non supportate
Rete accelerata: supportata
Disco del sistema operativo temporaneo: supportato
Virtualizzazione annidata: non supportata
Dimensioni nella serie
vCPU (Qtà) e memoria per ogni dimensione
Nome dimensione |
vCPU (Qtà) |
Memoria (GB) |
Standard_ND96isr_H200_v5 |
96 |
1850 |
Risorse di base della macchina virtuale
Informazioni di archiviazione locali (temp) per ogni dimensione
Nome dimensione |
Dischi di archiviazione temporanea massima (Qtà) |
Dimensioni del disco temporaneo (GiB) |
Standard_ND96isr_H200_v5 |
1 |
28000 |
Risorse di archiviazione
Definizioni di tabella
-
1La velocità del disco temporaneo differisce spesso tra le operazioni RR (Random Read) e RW (Random Write). Le operazioni RR sono in genere più veloci rispetto a quelle RW. La velocità RW è in genere più lenta rispetto a quella RR nelle serie in cui è elencato solo il valore di velocità RR.
- La capacità di archiviazione viene visualizzata in unità di GiB o 1.024^3 byte. Quando si confrontano i dischi misurati in GB (1000^3 byte) con i dischi misurati in GiB (1024^3), tenere presente che i numeri di capacità specificati in GiB potrebbero apparire più piccoli. Ad esempio, 1.023 GiB = 1.098,4 GB.
- La velocità effettiva del disco viene misurata in operazioni di input/output al secondo (IOPS) e MBps, dove il valore di MBps corrisponde a 10^6 byte al secondo.
- Per informazioni su come ottenere le migliori prestazioni di archiviazione per le macchine virtuali, vedere Prestazioni delle macchine virtuali e dei dischi.
Informazioni di archiviazione remote (non memorizzate) per ogni dimensione
Nome dimensione |
Archiviazione remota massima su dischi (Qtà) |
Operazioni di I/O al secondo del disco senza memorizzazione nella cache |
Velocità (MBps) del disco senza memorizzazione nella cache |
Standard_ND96isr_H200_v5 |
16 |
40800 |
612 |
Risorse di archiviazione
Definizioni di tabella
-
1Alcune dimensioni supportano il bursting per migliorare temporaneamente le prestazioni del disco. La velocità di burst può essere mantenuta per un massimo di 30 minuti alla volta.
-
2Archiviazione speciale si riferisce all'archiviazione su disco Ultra o su SSD Premium v2.
- La capacità di archiviazione viene visualizzata in unità di GiB o 1.024^3 byte. Quando si confrontano i dischi misurati in GB (1000^3 byte) con i dischi misurati in GiB (1024^3), tenere presente che i numeri di capacità specificati in GiB potrebbero apparire più piccoli. Ad esempio, 1.023 GiB = 1.098,4 GB.
- La velocità effettiva del disco viene misurata in operazioni di input/output al secondo (IOPS) e MBps, dove il valore di MBps corrisponde a 10^6 byte al secondo.
- I dischi dati possono operare in modalità memorizzata nella cache o non memorizzata nella cache. Per il funzionamento dei dischi dati memorizzati nella cache, la modalità di cache host è impostata su ReadOnly o su ReadWrite. Per il funzionamento dei dischi dati non memorizzati nella cache, la modalità di cache host è impostata su None.
- Per informazioni su come ottenere le migliori prestazioni di archiviazione per le macchine virtuali, vedere Prestazioni delle macchine virtuali e dei dischi.
Informazioni sull'interfaccia di rete per ogni dimensione
Nome dimensione |
N. max schede di interfaccia di rete (Qtà) |
Larghezza di banda massima (Mbps) |
Standard_ND96isr_H200_v5 |
8 |
80000 |
Risorse di rete
Definizioni di tabella
- La larghezza di banda della rete prevista è la larghezza di banda aggregata massima allocata per ogni tipo di macchina virtuale in tutte le schede di interfaccia di rete, per tutte le destinazioni. Per altre informazioni, vedere Larghezza di banda di rete delle macchine virtuali.
- I limiti superiori non sono garantiti. I limiti offrono indicazioni per la selezione del tipo di macchina virtuale appropriato per l'applicazione desiderata. Le prestazioni di rete effettive dipendono da diversi fattori, come la congestione della rete, i carichi dell'applicazione e le impostazioni di rete. Per informazioni sull'ottimizzazione della velocità effettiva della rete, vedere Ottimizzare la velocità effettiva di rete per macchine virtuali di Azure.
- Per realizzare le prestazioni di rete previste in Linux o Windows, potrebbe essere necessario selezionare una versione specifica o ottimizzare la macchina virtuale. Per altre informazioni, vedere Test di larghezza di banda/velocità effettiva (NTTTCP).
Informazioni sull'acceleratore (GPU, FPGA e così via) per ogni dimensione
Nome dimensione |
Acceleratori (Qtà) |
Memoria dell'acceleratore (GB) |
Standard_ND96isr_H200_v5 |
8 |
1128 |
Elenco di tutte le dimensioni disponibili: Dimensioni
Calcolatore dei prezzi: Calcolatore dei prezzi
Informazioni sui tipi di dischi: Tipi di dischi
Passaggi successivi
Sfruttare le prestazioni e le funzionalità più recenti disponibili per i carichi di lavoro modificando le dimensioni di una macchina virtuale.
Usare processori ARM progettati internamente da Microsoft con macchine virtuali Cobalt di Azure.
Informazioni su come Monitorare le macchine virtuali di Azure.