ND A100 v4 시리즈

적용 대상: ✔️ Linux VM ✔️ 유연한 확장 집합 ✔️ 균일한 확장 집합

ND A100 v4 시리즈 가상 머신은 고급 Deep Learning 학습 및 긴밀하게 결합된 HPC 워크로드 스케일 업 및 스케일 아웃을 위해 설계된 Azure GPU 제품군에 새로 추가된 주력 가상 머신입니다.

ND A100 v4 시리즈는 단일 VM(가상 머신) 및 8개의 NVIDIA Ampere A100 40GB Tensor Core GPU로 시작합니다. ND A100 v4 기반 배포는 VM당 1.6Tb/초의 상호 연결 대역폭을 사용하여 수천 개의 GPU로 스케일 업할 수 있습니다. VM 내의 각 GPU에는 고유한 전용 토폴로지 독립적 200Gb/초 NVIDIA Mellanox HDR InfiniBand 연결이 제공됩니다. 이러한 연결은 동일한 가상 머신 확장 집합을 차지하는 VM 간에 자동으로 구성되며 GPUDirect RDMA를 지원합니다.

각 GPU는 VM 내의 통신을 위한 NVLINK 3.0 연결을 제공하며, 인스턴스는 96 물리적 2세대 AMD Epyc™ 7V12(Rome) CPU 코어에서도 지원됩니다.

이러한 인스턴스는 GPU 가속화를 '기본으로' 지원하는 많은 AI, ML, 분석 도구(예: TensorFlow, Pytorch, Caffe, RAPIDS, 다른 프레임워크)에 탁월한 성능을 제공합니다. 또한 스케일 아웃 InfiniBand 상호 연결은 GPU의 원활한 클러스터링을 위해 NVIDIA의 NCCL2 통신 라이브러리를 기반으로 하는 대규모 기존 AI 및 HPC 도구 집합에서 지원됩니다.

중요

ND A100 v4 VM을 시작하려면 HPC 워크로드 구성 및 최적화에서 드라이버 및 네트워크 구성 등의 단계를 참조하세요. GPU 메모리 I/O 공간의 증가로 인해 ND A100 v4는 2세대 VM 및 마켓플레이스 이미지를 사용해야 합니다. Azure HPC 이미지를 적극 권장합니다. Azure HPC Ubuntu 18.04, 20.04 및 Azure HPC CentOS 7.9 이미지가 지원됩니다.


Premium Storage: 지원됨
Premium Storage 캐싱: 지원됨
Ultra Disks: 지원됨(가용성, 사용량 및 성능에 대해 자세히 알아보기)
실시간 마이그레이션: 지원되지 않음
메모리 보존 업데이트: 지원되지 않음
VM 생성 지원: 2세대
가속화된 네트워킹: 지원됨
임시 OS 디스크: 지원됨
InfiniBand: 지원됨, GPUDirect RDMA, 8 x 200 Gigabit HDR
Nvidia NVLink Interconnect: 지원됨
중첩 가상화: 지원되지 않음

ND A100 v4 시리즈는 다음과 같은 커널 버전을 지원합니다.
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

크기 vCPU 메모리: GiB 임시 스토리지(SSD): GiB GPU GPU 메모리: GiB 최대 데이터 디스크 수 최대 캐시되지 않은 디스크 처리량: IOPS/MBps 최대 네트워크 대역폭 최대 NIC 수
Standard_ND96asr_v4 96 900 6000 8 A100 40 GB GPU(NVLink 3.0) 40 32 80,000 / 800 24,000Mbps 8

크기 테이블 정의

  • 스토리지 용량 단위는 GiB(1024^3바이트) 단위로 표시됩니다. GB(1000^3바이트) 단위로 측정된 디스크를 GiB(1024^3바이트) 단위로 측정된 디스크와 비교할 때는 GiB 단위로 지정된 용량 수치가 더 작게 표시될 수 있음에 유의해야 합니다. 예를 들어 1023GiB = 1098.4GB입니다.

  • 디스크 처리량은 IOPS(초당 입/출력 작업 수) 및 MBps로 측정되며, MBps = 10^6바이트/초입니다.

  • 데이터 디스크는 캐시된 모드 또는 캐시되지 않은 모드에서 작동할 수 있습니다. 캐시된 데이터 디스크 작업의 경우 호스트 캐시 모드가 ReadOnly 또는 ReadWrite로 설정됩니다. 캐시되지 않은 데이터 디스크 작업의 경우에는 호스트 캐시 모드가 None으로 설정됩니다.

  • VM에 가장 적합한 스토리지 성능을 얻는 방법에 대해 알아보려면 가상 머신 및 디스크 성능을 참조하세요.

  • 예상 네트워크 대역폭은 모든 NIC에서 모든 대상에 대해 VM 유형별로 할당된 최대 집계 대역폭입니다. 자세한 내용은 가상 머신 네트워크 대역폭을 참조하세요.

    상한은 보장되지 않습니다. 제한은 원하는 애플리케이션에 적합한 VM 유형을 선택하기 위한 지침을 제공합니다. 실제 네트워크 성능은 네트워크 정체, 애플리케이션 로드 및 네트워크 설정을 비롯한 여러 요인에 따라 달라집니다. 네트워크 처리량 최적화에 대한 정보는 Azure 가상 머신에 대한 네트워크 처리량 최적화를 참조하세요. Linux 또는 Windows에서 예상되는 네트워크 성능을 달성하려면 특정 버전을 선택하거나 VM을 최적화해야 할 수도 있습니다. 자세한 내용은 대역폭/처리량 테스트(NTTTCP)를 참조하세요.

기타 크기 및 정보

가격 계산기: 가격 계산기

디스크 유형에 대한 자세한 내용은 Azure에서 사용할 수 있는 디스크 유형을 참조하세요.

다음 단계

ACU(Azure 컴퓨팅 단위)가 Azure SKU 간의 Compute 성능을 비교하는 데 어떻게 도움을 줄 수 있는지 알아봅니다.