NC A100 série v4
Atenção
Este artigo faz referência ao CentOS, uma distribuição Linux com status de Fim de Vida (EOL). Por favor, considere o seu uso e planeje de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes
A máquina virtual (VM) da série NC A100 v4 é uma nova adição à família de GPUs do Azure. Você pode usar esta série para treinamento de IA aplicada do Azure no mundo real e cargas de trabalho de inferência em lote.
A série NC A100 v4 é alimentada por GPU PCIe NVIDIA A100 e processadores AMD EPYC™ 7V13 (Milão) de terceira geração. As VMs apresentam até 4 GPUs PCIe NVIDIA A100 com 80 GB de memória cada, até 96 núcleos de processador AMD EPYC Milan não multithreaded e 880 GiB de memória do sistema. Essas VMs são ideais para cargas de trabalho de IA aplicada do mundo real, como:
- Análise e bancos de dados acelerados por GPU
- Inferência em lote com pré e pós-processamento pesado
- Treinamento do modelo de autonomia
- Simulação de reservatórios de petróleo e gás
- Desenvolvimento de Machine Learning (ML)
- Processamento de vídeo
- Serviços Web de IA/ML
Funcionalidades suportadas
Para começar a usar as VMs NC A100 v4, consulte Configuração e otimização da carga de trabalho HPC para obter as etapas que incluem a configuração do driver e da rede.
Devido ao aumento da pegada de E/S de memória da GPU, o NC A100 v4 requer o uso de VMs de 2ª geração e imagens de mercado. Embora as imagens HPC do Azure sejam recomendadas, as imagens do Azure HPC Ubuntu 20.04 e Azure HPC CentOS 7.9, RHEL 8.8, RHEL 9.2, Windows Server 2019 e Windows Server 2022 são suportadas.
- Armazenamento Premium: Suportado
- Cache de armazenamento premium: suportado
- Ultra Disks: Não suportado
- Migração ao vivo: não suportada
- Atualizações de preservação de memória: não suportadas
- Suporte à geração de VM: Geração 2
- Rede acelerada: suportada
- Discos de SO efémeros: Suportados
- InfiniBand: Não suportado
- NVIDIA NVLink Interconnect: Suportado
- Virtualização aninhada: não suportada
Tamanho | vCPU | Memória (GiB) | Temp Disk1 (GiB) | DiscosNVMe 2 | GPU 3 | Memória GPU (GiB) | Discos de dados máximos | Taxa de transferência máxima de disco sem cache (IOPS / MBps) | NICs máximas/largura de banda de rede (MBps) |
---|---|---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | 64 | 960 GB | 1 | 80 | 8 | 30000/1000 | 2/20,000 |
Standard_NC48ads_A100_v4 | 48 | 440 | 128 | 2x960 GB | 2 | 160 | 16 | 60000/2000 | 4/40,000 |
Standard_NC96ads_A100_v4 | 96 | 880 | 256 | 4x960 GB | 4 | 320 | 32 | 120000/4000 | 8/80,000 |
1 As VMs da série NC A100 v4 têm um disco de recursos temporários baseado em SCSI padrão para uso de arquivos de paginação/permuta do sistema operacional. Isso garante que as unidades NVMe possam ser totalmente dedicadas ao uso de aplicativos. Este disco é efêmero, e todos os dados serão perdidos em stop/deallocate.
2 Os discos NVMe locais são efêmeros, os dados serão perdidos nesses discos se você parar/desalocar sua VM. O disco NVMe local está vindo como RAM e precisa ser formatado manualmente na VM recém-implantada.
3 1 GPU = uma placa GPU A100 80GB PCIe
Definições da tabela de dimensionamento
A capacidade de armazenamento é apresentada em unidades de GiB ou 1024^3 bytes. Ao comparar discos medidos em GB (1000^3 bytes) com discos medidos em GiB (1024^3), lembre-se de que os números de capacidade fornecidos em GiB podem parecer menores. Por exemplo, 1023 GiB = 1098,4 GB.
O débito do disco é medido em operações de entrada/saída por segundo (IOPS) e MBps, em que MBps = 10^6 bytes/seg.
Os discos de dados podem operar nos modos em cache ou não colocado em cache. Para uma operação do disco de dados em cache, o modo de cache do anfitrião está definido como ReadOnly ou ReadWrite. Para uma operação do disco de dados não colocada em cache, o modo de cache do anfitrião está definido como None.
Para saber como obter o melhor desempenho de armazenamento para suas VMs, consulte Desempenho de máquina virtual e disco.
A largura de banda de rede esperada é a largura de banda agregada máxima alocada por tipo de VM em todas as NICs, para todos os destinos. Para obter mais informações, consulte Largura de banda de rede de máquina virtual.
Os limites máximos não são garantidos. Os limites oferecem orientação para selecionar o tipo de VM certo para o aplicativo pretendido. O desempenho real da rede dependerá de vários fatores, incluindo congestionamento da rede, cargas de aplicativos e configurações de rede. Para obter informações sobre como otimizar a taxa de transferência de rede, consulte Otimizar a taxa de transferência de rede para máquinas virtuais do Azure. Para alcançar o desempenho de rede esperado no Linux ou Windows, talvez seja necessário selecionar uma versão específica ou otimizar sua VM. Para obter mais informações, consulte Teste de largura de banda/taxa de transferência (NTTTCP).
Outros tamanhos e informações
- Fins gerais
- Com otimização de memória
- Com otimização de armazenamento
- Com otimização de GPU
- Computação de elevado desempenho
- Gerações anteriores
Você pode usar a calculadora de preços para estimar os custos de suas VMs do Azure.
Para obter mais informações sobre tipos de disco, consulte Que tipos de disco estão disponíveis no Azure?
Próximo passo
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários