Partilhar via


ND MI300X série v5

Aplica-se a: ✔️ Linux VMs ✔️ Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

A máquina virtual (VM) da série ND MI300X v5 é uma nova adição emblemática à família de GPUs do Azure. Ele foi projetado para treinamento de Deep Learning high-end e cargas de trabalho de IA generativa e HPC fortemente acopladas.

A VM da série ND MI300X v5 começa com oito GPUs AMD Instinct MI300 e dois processadores escaláveis Intel Xeon de quarta geração para um total de 96 núcleos físicos. Cada GPU dentro da VM é então conectada uma à outra por meio de links AMD Infinity Fabric de 4ª geração com largura de banda de 128 GB/s por GPU e largura de banda agregada de 896 GB/s.

As implantações baseadas em ND MI300X v5 podem ser dimensionadas para milhares de GPUs com 3,2 Tb/s de largura de banda de interconexão por VM. Cada GPU dentro da VM é fornecida com sua própria conexão dedicada e independente de topologia de 400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand. Essas conexões são configuradas automaticamente entre VMs que ocupam o mesmo conjunto de escala de máquina virtual e suportam GPUDirect RDMA.

Essas instâncias oferecem excelente desempenho para muitas ferramentas de IA, ML e análise que suportam aceleração de GPU "pronta para uso", como TensorFlow, Pytorch e outras estruturas. Além disso, a interconexão InfiniBand escalável suporta um grande conjunto de ferramentas de IA e HPC existentes que são construídas na ROCm Communication Collectives Library (RCCL) da AMD para clustering contínuo de GPUs.

Especificações do anfitrião

Parte Quantidade
Unidades de contagem
Especificações
ID de SKU, Unidades de Desempenho, etc.
Processador 96 vCores Intel® Xeon® Scalable (corredeiras de safira)
Memória GiB de 1850
Armazenamento Local 1 Disco 1000 GiB
Discos remotos 32 discos 40800 IOPS
612 MBps
Rede 8 NICs 80000 Mbps
Aceleradores 8 GPUs AMD MI300X 192 GiB
1535 GiB por VM

Suporte de funcionalidades

Armazenamento Premium: Suportado
Cache de armazenamento premium: suportado
Ultra disco: suportado Saiba mais sobre disponibilidade, uso e desempenho
Migração ao vivo: não suportada
Atualizações de preservação de memória: não suportadas
Suporte à geração de VM: Geração 2
Rede acelerada: suportada
Discos de SO efémeros: Suportados
Infiniband: Suportado, GPUDirect RDMA, 8x400 Gigabit NDR
Virtualização aninhada: não suportada

Importante

Para começar a usar as VMs ND MI300X v5, consulte Configuração e otimização da carga de trabalho HPC para obter as etapas que incluem a configuração do driver e da rede. Devido ao aumento da pegada de E/S de memória da GPU, o ND MI300X v5 requer o uso de VMs de Geração 2 e imagens de mercado.

Tamanhos em série

Tamanho vCPU Memória: GiB Armazenamento (SSD) temporário GiB GPU Memória GPU GiB Discos de dados máximos Taxa de transferência máxima de disco sem cache: IOPS/MBps Largura de banda máxima da rede NICs máximos
Standard_ND96isr_MI300X_v5 96 1850 1000 8 MI300X 192 32 40800/612 80.000 Mbps 8

Definições da tabela de dimensionamento

  • A capacidade de armazenamento é apresentada em unidades de GiB ou 1024^3 bytes. Ao comparar discos medidos em GB (1000^3 bytes) com discos medidos em GiB (1024^3), lembre-se de que os números de capacidade fornecidos em GiB podem parecer menores. Por exemplo, 1023 GiB = 1098,4 GB.

  • O débito do disco é medido em operações de entrada/saída por segundo (IOPS) e MBps, em que MBps = 10^6 bytes/seg.

  • Os discos de dados podem operar nos modos em cache ou não colocado em cache. Para uma operação do disco de dados em cache, o modo de cache do anfitrião está definido como ReadOnly ou ReadWrite. Para uma operação do disco de dados não colocada em cache, o modo de cache do anfitrião está definido como None.

  • Para saber como obter o melhor desempenho de armazenamento para suas VMs, consulte Desempenho de máquina virtual e disco.

  • A largura de banda de rede esperada é a largura de banda agregada máxima alocada por tipo de VM em todas as NICs, para todos os destinos. Para obter mais informações, consulte Largura de banda de rede de máquina virtual.

    Os limites máximos não são garantidos. Os limites oferecem orientação para selecionar o tipo de VM certo para o aplicativo pretendido. O desempenho real da rede dependerá de vários fatores, incluindo congestionamento da rede, cargas de aplicativos e configurações de rede. Para obter informações sobre como otimizar a taxa de transferência de rede, consulte Otimizar a taxa de transferência de rede para máquinas virtuais do Azure. Para alcançar o desempenho de rede esperado no Linux ou Windows, talvez seja necessário selecionar uma versão específica ou otimizar sua VM. Para obter mais informações, consulte Teste de largura de banda/taxa de transferência (NTTTCP).

Outras informações sobre o tamanho

Lista de todos os tamanhos disponíveis: Tamanhos

Calculadora de Preços: Calculadora de Preços

Informações sobre tipos de disco: Tipos de disco

Próximos passos

Saiba mais sobre como as unidades de computação do Azure (ACU) podem ajudá-lo a comparar o desempenho da computação entre as SKUs do Azure.

Confira os Hosts Dedicados do Azure para servidores físicos capazes de hospedar uma ou mais máquinas virtuais atribuídas a uma assinatura do Azure.

Saiba como Monitorar máquinas virtuais do Azure.