Seri ND H100 v5
Berlaku untuk: ✔️ VM Linux ✔️Set skala fleksibel ✔️ Set skala seragam
Mesin virtual (VM) seri ND H100 v5 adalah tambahan unggulan baru untuk keluarga GPU Azure. Ini dirancang untuk pelatihan Pembelajaran Mendalam kelas atas dan meningkatkan skala dan menskalakan beban kerja Generative AI dan HPC yang digabungkan dengan erat.
Seri ND H100 v5 dimulai dengan satu VM dan delapan GPU NVIDIA H100 Tensor Core. Penyebaran berbasis ND H100 v5 dapat menskalakan hingga ribuan GPU dengan bandwidth interkoneksi 3,2 Tb/dtk per VM. Setiap GPU dalam VM disediakan dengan koneksi Khusus, topologi-agnostik 400 Gb/dtk NVIDIA Quantum-2 CX7 InfiniBand. Koneksi ini secara otomatis dikonfigurasi antara VM yang menempati set skala mesin virtual yang sama, dan mendukung GPUDirect RDMA.
Setiap GPU memiliki konektivitas NVLINK 4.0 untuk komunikasi dalam VM, dan instans didukung oleh inti prosesor Intel Xeon Scalable Generasi ke-4 fisik 96.
Instans ini memberikan performa yang sangat baik untuk banyak alat AI, ML, dan analitik yang mendukung akselerasi GPU 'out-of-the-box,' seperti TensorFlow, Pytorch, Caffe, RAPIDS, dan kerangka kerja lainnya. Selain itu, interkoneksi InfiniBand peluasan skala didukung oleh sekumpulan besar alat AI dan HPC yang ada yang dibangun di atas pustaka komunikasi NCCL NVIDIA untuk pengklusteran GPU yang mulus.
Penyimpanan Premium: Didukung
Penembolokan Penyimpanan Premium: Didukung
Disk ultra: Didukung Pelajari selengkapnya tentang ketersediaan, penggunaan, dan performa
Migrasi Langsung: Tidak Didukung
Pembaruan yang Menyimpan Memori: Tidak Didukung
Dukungan Generasi VM: Generasi 2
Jaringan Terakselerasi: Didukung
Disk OS Ephemeral: Didukung
Infiniband: Didukung, GPUDirect RDMA, 8x400 Gigabit NDR
NVIDIA NVLink Interkoneksi: Didukung
Virtualisasi Berlapis: Tidak Didukung
Penting
Untuk mulai menggunakan VM ND H100 v5, lihat Konfigurasi dan Pengoptimalan Beban Kerja HPC untuk langkah-langkah termasuk konfigurasi driver dan jaringan. Karena peningkatan jejak I/O memori GPU, ND H100 v5 memerlukan penggunaan VM Generasi 2 dan gambar marketplace.
Azure mendukung Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2, dan SLES 15 untuk VM ND H100 v5. Di marketplace Azure, ada penawaran gambar VM Linux yang dioptimalkan dan telah dikonfigurasi sebelumnya untuk beban kerja HPC/AI dengan berbagai alat dan pustaka HPC yang diinstal, dan dengan demikian sangat disarankan. Saat ini, gambar VM Ubuntu-HPC 20.04/22.04 dan AlmaLinux-HPC 8.6/8.7 didukung.
Contoh
Ukuran | vCPU | Memori: GiB | Penyimpanan sementara (SSD) GiB | GPU | GiB Memori GPU | Disk data maksimal | Throughput disk maksimal yang tidak di-cache: IOPS/MBps | Bandwidth jaringan maks | NIC Maksimum |
---|---|---|---|---|---|---|---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 | 28000 | 8 GPU H100 80 GB (NVLink) | 80 | 32 | 40800/612 | 80.000 Mbps | 8 |
Definisi tabel ukuran
Kapasitas penyimpanan ditampilkan dalam unit GiB atau 1024^3 byte. Saat membandingkan disk yang diukur dalam GB (1000^3 byte) dengan disk yang diukur dalam GiB (1024^3), ingat bahwa jumlah kapasitas yang diberikan dalam GiB mungkin tampak lebih kecil. Misalnya, 1023 GiB = 1098,4 GB.
Throughput disk diukur dalam operasi input/output per detik (IOPS) dan MBps di mana MBps = 10^6 byte/detik.
Disk data dapat beroperasi dalam mode cache atau tidak di-cache. Untuk operasi disk data cache, mode cache host diatur ke ReadOnly atau ReadWrite. Untuk operasi disk data yang tidak di-cache, mode cache host diatur ke None.
Untuk mempelajari cara mendapatkan performa penyimpanan terbaik untuk VM Anda, lihat Komputer virtual dan performa disk.
Bandwidth jaringan yang diharapkan adalah bandwidth agregat maksimum yang dialokasikan per jenis VM di semua NIC, untuk semua tujuan. Untuk informasi selengkapnya, lihat Bandwidth jaringan komputer virtual.
Batas atas tidak dijamin. Batas menawarkan panduan untuk memilih jenis VM yang tepat untuk aplikasi yang dimaksud. Performa jaringan aktual akan tergantung pada beberapa faktor termasuk kemacetan jaringan, beban aplikasi, dan pengaturan jaringan. Untuk mengetahui informasi tentang mengoptimalkan throughput jaringan, lihat Mengoptimalkan throughput jaringan untuk komputer virtual Azure. Untuk mencapai performa jaringan yang diharapkan di Linux atau Windows, Anda mungkin perlu memilih versi tertentu atau mengoptimalkan VM Anda. Untuk mengetahui informasi selengkapnya, lihat Pengujian Bandwidth/Throughput (NTTTCP).
Ukuran serta informasi lainnya
- Tujuan umum
- Memori Dioptimalkan
- Penyimpanan dioptimalkan
- GPU dioptimalkan
- Komputasi performa tinggi
- Generasi sebelumnya
Informasi lebih lanjut tentang Jenis Disk: Jenis Disk
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk