Menggunakan instans RDMA atau GPU di kumpulan Batch
Untuk menjalankan pekerjaan Batch tertentu, Anda dapat memanfaatkan ukuran Azure VM yang dirancang untuk komputasi skala besar. Contohnya:
Untuk menjalankan beban kerja MPI multi-instans, pilih seri HB, HC, NC, atau ND atau ukuran lain yang memiliki antarmuka jaringan untuk Akses Memori Langsung Jarak Jauh (RDMA). Ukuran ini terhubung ke jaringan InfiniBand untuk komunikasi antar simpul, yang dapat mempercepat aplikasi MPI.
Untuk aplikasi CUDA, pilih ukuran seri N yang menyertakan kartu unit pemrosesan grafis (GPU) NVIDIA Tesla.
Artikel ini menyediakan panduan dan contoh untuk menggunakan beberapa ukuran khusus Azure di kumpulan Batch. Untuk spesifikasi dan latar belakang, lihat:
Catatan
Ukuran komputer virtual tertentu mungkin tidak tersedia di wilayah tempat Anda membuat akun Batch. Untuk memeriksa apakah ukuran tersedia, lihat Produk yang tersedia berdasarkan wilayah dan Pilih ukuran komputer virtual untuk kumpulan Batch.
Dependensi
Kemampuan RDMA atau GPU dari ukuran komputasi intensif dalam Batch hanya didukung dalam sistem operasi tertentu. Sistem operasi yang didukung untuk ukuran VM ini hanya mencakup subset yang tersedia untuk pembuatan komputer virtual. Bergantung pada cara Anda membuat kumpulan Batch, Anda mungkin perlu menginstal atau mengonfigurasi driver tambahan atau perangkat lunak lain pada simpul. Tabel berikut ini meringkas dependensi ini. Lihat artikel tertaut untuk detailnya. Untuk opsi mengonfigurasi kumpulan Batch, lihat nanti di artikel ini.
Kumpulan Linux - Konfigurasi komputer virtual
Ukuran | Kemampuan | Sistem operasi | Perangkat lunak yang diperlukan | Pengaturan kumpulan |
---|---|---|---|---|
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs* |
RDMA | Ubuntu 22.04 LTS (Marketplace Azure) |
Intel MPI 5 Driver RDMA Linux |
Aktifkan komunikasi antar simpul, nonaktifkan eksekusi tugas bersamaan |
Seri NCv3, NDv2, NDv4, NDv5 | GPU NVIDIA Tesla (bervariasi menurut seri) | Ubuntu 22.04 LTS (Marketplace Azure) |
Driver NVIDIA CUDA atau CUDA Toolkit | T/A |
Seri NVv3, NVv4, NVv5 | GPU Visualisasi Dipercepat | Ubuntu 22.04 LTS (Marketplace Azure) |
Driver NVIDIA GRID (jika diperlukan) | T/A |
*Ukuran seri N berkemampuan RDMA juga mencakup GPU NVIDIA Tesla
Penting
Dokumen ini mereferensikan versi rilis Linux yang mendekati atau di, End of Life(EOL). Harap pertimbangkan untuk memperbarui ke versi yang lebih baru.
Kumpulan Windows - Konfigurasi Komputer Virtual
Ukuran | Kemampuan | Sistem operasi | Perangkat lunak yang diperlukan | Pengaturan kumpulan |
---|---|---|---|---|
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs* |
RDMA | Windows Server 2016, 2012 R2, atau 2012 (Marketplace Azure) |
Microsoft MPI 2012 R2 atau yang lebih baru, atau Intel MPI 5 Driver RDMA Windows |
Aktifkan komunikasi antar simpul, nonaktifkan eksekusi tugas bersamaan |
Seri NC, NCv2, NCv3, ND, NDv2 | GPU NVIDIA Tesla (bervariasi menurut seri) | Windows Server 2016 atau 2012 R2 (Marketplace Azure) |
Driver NVIDIA CUDA atau CUDA Toolkit | T/A |
Seri NV, NVv2, NVv4 | NVIDIA Tesla M60 GPU | Windows Server 2016 atau 2012 R2 (Marketplace Azure) |
Driver NVIDIA GRID | T/A |
*Ukuran seri N berkemampuan RDMA juga mencakup GPU NVIDIA Tesla
Kumpulan Windows - Konfigurasi Microsoft Azure Cloud Services
Peringatan
Kumpulan Konfigurasi Microsoft Azure Cloud Services tidak digunakan lagi. Silakan gunakan kumpulan Konfigurasi Komputer Virtual sebagai gantinya.
Ukuran | Kemampuan | Sistem operasi | Perangkat lunak yang diperlukan | Pengaturan kumpulan |
---|---|---|---|---|
H16r, H16mr | RDMA | Windows Server 2016, 2012 R2, 2012, atau 2008 R2 (Keluarga OS tamu) |
Microsoft MPI 2012 R2 atau yang lebih baru, atau Intel MPI 5 Driver RDMA Windows |
Aktifkan komunikasi antar simpul, nonaktifkan eksekusi tugas bersamaan |
Catatan
Ukuran seri N tidak didukung di kumpulan Konfigurasi Cloud Services.
Opsi konfigurasi kumpulan
Untuk mengonfigurasi ukuran komputer virtual khusus untuk kumpulan Batch, Anda memiliki beberapa opsi untuk memasang perangkat lunak atau driver yang diperlukan:
Untuk kumpulan dalam konfigurasi komputer virtual, pilih gambar komputer virtual Marketplace Azure yang telah dikonfigurasi sebelumnya yang memiliki driver dan perangkat lunak yang telah dipasang sebelumnya. Contoh:
Data Science Virtual Machine untuk Linux atau Windows - termasuk driver NVIDIA CUDA
Gambar Linux untuk beban kerja kontainer Batch yang juga mencakup driver GPU dan RDMA:
Ubuntu Server (dengan driver GPU dan RDMA) untuk kumpulan kontainer Azure Batch
Buat gambar VM Windows atau Linux kustom dengan driver, perangkat lunak, atau pengaturan lain yang terinstal yang diperlukan untuk ukuran VM.
Buat paket aplikasi Batch dari driver zip atau penginstal aplikasi. Kemudian, konfigurasikan Batch untuk menyebarkan paket ini ke simpul kumpulan dan menginstal sekali ketika setiap simpul dibuat. Misalnya, jika paket aplikasi adalah alat penginstal, buat baris perintah tugas mulai untuk memasang aplikasi secara diam-diam di semua simpul kumpulan. Pertimbangkan untuk menggunakan paket aplikasi dan tugas mulai kumpulan jika beban kerja Anda bergantung pada versi driver tertentu.
Catatan
Tugas mulai harus dijalankan dengan izin yang ditinggikan (admin), dan harus menunggu sukses. Tugas yang berjalan lama akan menambah waktu untuk menyediakan kumpulan Batch.
Contoh: Driver GPU NVIDIA pada kumpulan komputer virtual Windows NC
Untuk menjalankan aplikasi CUDA pada kumpulan simpul Windows NC, Anda perlu memasang driver GPU NVDIA. Langkah-langkah sampel berikut menggunakan paket aplikasi untuk memasang driver GPU NVIDIA. Anda dapat memilih opsi ini jika beban kerja bergantung pada versi driver GPU tertentu.
- Unduh paket penyiapan untuk driver GPU di Windows Server 2016 dari situs web NVIDIA - misalnya, versi 411.82. Simpan file secara lokal menggunakan nama pendek seperti GPUDriverSetup.exe.
- Buat file zip paket.
- Unggah paket ke akun Batch Anda. Untuk langkah-langkahnya, lihat panduan paket aplikasi. Tentukan ID aplikasi seperti GPUDriver, dan versi seperti 411.82.
- Menggunakan API Batch atau portal Microsoft Azure, buat kumpulan di konfigurasi komputer virtual dengan jumlah simpul dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan sampel untuk memasang driver GPU NVIDIA secara diam-diam menggunakan tugas mulai:
Pengaturan | Nilai |
---|---|
Jenis Gambar | Marketplace (Linux/Windows) |
Penerbit | MicrosoftWindowsServer |
Penawaran | WindowsServer |
Sku | 2016-Pusat Data |
Ukuran simpul | Standar NC6 |
Referensi paket aplikasi | GPUDriver, versi 411.82 |
Tugas mulai diaktifkan | Benar Baris perintah - cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s" Identitas pengguna - Pengguna otomatis kumpulan, admin Tunggu berhasil - True |
Contoh: Driver GPU NVIDIA pada kumpulan komputer virtual Linux NC
Untuk menjalankan aplikasi CUDA pada kumpulan simpul Linux NC, Anda perlu memasang driver GPU NVIDIA Tesla yang diperlukan dari CUDA Toolkit. Langkah-langkah sampel berikut membuat dan menyebarkan gambar Ubuntu 22.04 LTS kustom dengan driver GPU:
- Sebarkan VM seri Azure NC yang menjalankan Ubuntu 22.04 LTS. Misalnya, buat komputer virtual di wilayah US Tengah Selatan.
- Tambahkan ekstensi Driver GPU NVIDIA ke komputer virtual dengan menggunakan portal Microsoft Azure, komputer klien yang tersambung ke langganan Azure, atau Azure Cloud Shell. Atau, ikuti langkah-langkah untuk terhubung ke komputer virtual dan pasang driver CUDA secara manual.
- Ikuti langkah-langkah untuk membuat gambar Azure Compute Gallery untuk Batch.
- Buat akun Batch di wilayah yang mendukung VM NC.
- Menggunakan API Batch atau portal Microsoft Azure, buat kumpulan menggunakan gambar kustom dan dengan jumlah simpul dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan kumpulan sampel untuk gambar:
Pengaturan | Nilai |
---|---|
Jenis Gambar | Gambar Kustom |
Gambar Kustom | Nama gambar |
SKU agen simpul | batch.node.ubuntu 22.04 |
Ukuran simpul | Standar NC6 |
Contoh: Microsoft MPI pada kumpulan komputer virtual Windows H16r
Untuk menjalankan aplikasi Windows MPI pada kumpulan simpul komputer virtual Azure H16r, Anda perlu mengonfigurasi ekstensi HpcVmDrivers dan memasang Microsoft MPI. Berikut adalah langkah-langkah sampel untuk menyebarkan gambar Windows Server 2016 kustom dengan driver dan perangkat lunak yang diperlukan:
- Sebarkan komputer virtual Azure H16r yang menjalankan Windows Server 2016. Misalnya, buat komputer virtual di wilayah US Barat.
- Tambahkan ekstensi HpcVmDrivers ke komputer virtual dengan menjalankan perintah Azure PowerShell dari komputer klien yang tersambung ke langganan Azure Anda, atau menggunakan Azure Cloud Shell.
- Membuat koneksi Desktop Jarak Jauh ke komputer virtual.
- Unduh paket penyiapan (MSMpiSetup.exe) untuk versi terbaru Microsoft MPI, dan pasang Microsoft MPI.
- Ikuti langkah-langkah untuk membuat gambar Azure Compute Gallery untuk Batch.
- Dengan menggunakan API Batch atau portal Microsoft Azure, buat kumpulan menggunakan Azure Compute Gallery dan dengan jumlah node dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan kumpulan sampel untuk gambar:
Pengaturan | Nilai |
---|---|
Jenis Gambar | Gambar Kustom |
Gambar Kustom | Nama gambar |
SKU agen simpul | batch.node.windows amd64 |
Ukuran simpul | Standar H16r |
Komunikasi antar-simpul diaktifkan | Benar |
Tugas maks per simpul | 1 |