Bagikan melalui


Menggunakan instans RDMA atau GPU di kumpulan Batch

Untuk menjalankan pekerjaan Batch tertentu, Anda dapat memanfaatkan ukuran Azure VM yang dirancang untuk komputasi skala besar. Contohnya:

  • Untuk menjalankan beban kerja MPI multi-instans, pilih seri HB, HC, NC, atau ND atau ukuran lain yang memiliki antarmuka jaringan untuk Akses Memori Langsung Jarak Jauh (RDMA). Ukuran ini terhubung ke jaringan InfiniBand untuk komunikasi antar simpul, yang dapat mempercepat aplikasi MPI.

  • Untuk aplikasi CUDA, pilih ukuran seri N yang menyertakan kartu unit pemrosesan grafis (GPU) NVIDIA Tesla.

Artikel ini menyediakan panduan dan contoh untuk menggunakan beberapa ukuran khusus Azure di kumpulan Batch. Untuk spesifikasi dan latar belakang, lihat:

Catatan

Ukuran komputer virtual tertentu mungkin tidak tersedia di wilayah tempat Anda membuat akun Batch. Untuk memeriksa apakah ukuran tersedia, lihat Produk yang tersedia berdasarkan wilayah dan Pilih ukuran komputer virtual untuk kumpulan Batch.

Dependensi

Kemampuan RDMA atau GPU dari ukuran komputasi intensif dalam Batch hanya didukung dalam sistem operasi tertentu. Sistem operasi yang didukung untuk ukuran VM ini hanya mencakup subset yang tersedia untuk pembuatan komputer virtual. Bergantung pada cara Anda membuat kumpulan Batch, Anda mungkin perlu menginstal atau mengonfigurasi driver tambahan atau perangkat lunak lain pada simpul. Tabel berikut ini meringkas dependensi ini. Lihat artikel tertaut untuk detailnya. Untuk opsi mengonfigurasi kumpulan Batch, lihat nanti di artikel ini.

Kumpulan Linux - Konfigurasi komputer virtual

Ukuran Kemampuan Sistem operasi Perangkat lunak yang diperlukan Pengaturan kumpulan
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Ubuntu 22.04 LTS
(Marketplace Azure)
Intel MPI 5

Driver RDMA Linux
Aktifkan komunikasi antar simpul, nonaktifkan eksekusi tugas bersamaan
Seri NCv3, NDv2, NDv4, NDv5 GPU NVIDIA Tesla (bervariasi menurut seri) Ubuntu 22.04 LTS
(Marketplace Azure)
Driver NVIDIA CUDA atau CUDA Toolkit T/A
Seri NVv3, NVv4, NVv5 GPU Visualisasi Dipercepat Ubuntu 22.04 LTS
(Marketplace Azure)
Driver NVIDIA GRID (jika diperlukan) T/A

*Ukuran seri N berkemampuan RDMA juga mencakup GPU NVIDIA Tesla

Penting

Dokumen ini mereferensikan versi rilis Linux yang mendekati atau di, End of Life(EOL). Harap pertimbangkan untuk memperbarui ke versi yang lebih baru.

Kumpulan Windows - Konfigurasi Komputer Virtual

Ukuran Kemampuan Sistem operasi Perangkat lunak yang diperlukan Pengaturan kumpulan
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Windows Server 2016, 2012 R2, atau
2012 (Marketplace Azure)
Microsoft MPI 2012 R2 atau yang lebih baru, atau
Intel MPI 5

Driver RDMA Windows
Aktifkan komunikasi antar simpul, nonaktifkan eksekusi tugas bersamaan
Seri NC, NCv2, NCv3, ND, NDv2 GPU NVIDIA Tesla (bervariasi menurut seri) Windows Server 2016 atau
2012 R2 (Marketplace Azure)
Driver NVIDIA CUDA atau CUDA Toolkit T/A
Seri NV, NVv2, NVv4 NVIDIA Tesla M60 GPU Windows Server 2016 atau
2012 R2 (Marketplace Azure)
Driver NVIDIA GRID T/A

*Ukuran seri N berkemampuan RDMA juga mencakup GPU NVIDIA Tesla

Kumpulan Windows - Konfigurasi Microsoft Azure Cloud Services

Peringatan

Kumpulan Konfigurasi Microsoft Azure Cloud Services tidak digunakan lagi. Silakan gunakan kumpulan Konfigurasi Komputer Virtual sebagai gantinya.

Ukuran Kemampuan Sistem operasi Perangkat lunak yang diperlukan Pengaturan kumpulan
H16r, H16mr RDMA Windows Server 2016, 2012 R2, 2012, atau
2008 R2 (Keluarga OS tamu)
Microsoft MPI 2012 R2 atau yang lebih baru, atau
Intel MPI 5

Driver RDMA Windows
Aktifkan komunikasi antar simpul,
nonaktifkan eksekusi tugas bersamaan

Catatan

Ukuran seri N tidak didukung di kumpulan Konfigurasi Cloud Services.

Opsi konfigurasi kumpulan

Untuk mengonfigurasi ukuran komputer virtual khusus untuk kumpulan Batch, Anda memiliki beberapa opsi untuk memasang perangkat lunak atau driver yang diperlukan:

  • Untuk kumpulan dalam konfigurasi komputer virtual, pilih gambar komputer virtual Marketplace Azure yang telah dikonfigurasi sebelumnya yang memiliki driver dan perangkat lunak yang telah dipasang sebelumnya. Contoh:

  • Data Science Virtual Machine untuk Linux atau Windows - termasuk driver NVIDIA CUDA

  • Gambar Linux untuk beban kerja kontainer Batch yang juga mencakup driver GPU dan RDMA:

  • Ubuntu Server (dengan driver GPU dan RDMA) untuk kumpulan kontainer Azure Batch

  • Buat gambar VM Windows atau Linux kustom dengan driver, perangkat lunak, atau pengaturan lain yang terinstal yang diperlukan untuk ukuran VM.

  • Buat paket aplikasi Batch dari driver zip atau penginstal aplikasi. Kemudian, konfigurasikan Batch untuk menyebarkan paket ini ke simpul kumpulan dan menginstal sekali ketika setiap simpul dibuat. Misalnya, jika paket aplikasi adalah alat penginstal, buat baris perintah tugas mulai untuk memasang aplikasi secara diam-diam di semua simpul kumpulan. Pertimbangkan untuk menggunakan paket aplikasi dan tugas mulai kumpulan jika beban kerja Anda bergantung pada versi driver tertentu.

    Catatan

    Tugas mulai harus dijalankan dengan izin yang ditinggikan (admin), dan harus menunggu sukses. Tugas yang berjalan lama akan menambah waktu untuk menyediakan kumpulan Batch.

Contoh: Driver GPU NVIDIA pada kumpulan komputer virtual Windows NC

Untuk menjalankan aplikasi CUDA pada kumpulan simpul Windows NC, Anda perlu memasang driver GPU NVDIA. Langkah-langkah sampel berikut menggunakan paket aplikasi untuk memasang driver GPU NVIDIA. Anda dapat memilih opsi ini jika beban kerja bergantung pada versi driver GPU tertentu.

  1. Unduh paket penyiapan untuk driver GPU di Windows Server 2016 dari situs web NVIDIA - misalnya, versi 411.82. Simpan file secara lokal menggunakan nama pendek seperti GPUDriverSetup.exe.
  2. Buat file zip paket.
  3. Unggah paket ke akun Batch Anda. Untuk langkah-langkahnya, lihat panduan paket aplikasi. Tentukan ID aplikasi seperti GPUDriver, dan versi seperti 411.82.
  4. Menggunakan API Batch atau portal Microsoft Azure, buat kumpulan di konfigurasi komputer virtual dengan jumlah simpul dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan sampel untuk memasang driver GPU NVIDIA secara diam-diam menggunakan tugas mulai:
Pengaturan Nilai
Jenis Gambar Marketplace (Linux/Windows)
Penerbit MicrosoftWindowsServer
Penawaran WindowsServer
Sku 2016-Pusat Data
Ukuran simpul Standar NC6
Referensi paket aplikasi GPUDriver, versi 411.82
Tugas mulai diaktifkan Benar
Baris perintah - cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s"
Identitas pengguna - Pengguna otomatis kumpulan, admin
Tunggu berhasil - True

Contoh: Driver GPU NVIDIA pada kumpulan komputer virtual Linux NC

Untuk menjalankan aplikasi CUDA pada kumpulan simpul Linux NC, Anda perlu memasang driver GPU NVIDIA Tesla yang diperlukan dari CUDA Toolkit. Langkah-langkah sampel berikut membuat dan menyebarkan gambar Ubuntu 22.04 LTS kustom dengan driver GPU:

  1. Sebarkan VM seri Azure NC yang menjalankan Ubuntu 22.04 LTS. Misalnya, buat komputer virtual di wilayah US Tengah Selatan.
  2. Tambahkan ekstensi Driver GPU NVIDIA ke komputer virtual dengan menggunakan portal Microsoft Azure, komputer klien yang tersambung ke langganan Azure, atau Azure Cloud Shell. Atau, ikuti langkah-langkah untuk terhubung ke komputer virtual dan pasang driver CUDA secara manual.
  3. Ikuti langkah-langkah untuk membuat gambar Azure Compute Gallery untuk Batch.
  4. Buat akun Batch di wilayah yang mendukung VM NC.
  5. Menggunakan API Batch atau portal Microsoft Azure, buat kumpulan menggunakan gambar kustom dan dengan jumlah simpul dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan kumpulan sampel untuk gambar:
Pengaturan Nilai
Jenis Gambar Gambar Kustom
Gambar Kustom Nama gambar
SKU agen simpul batch.node.ubuntu 22.04
Ukuran simpul Standar NC6

Contoh: Microsoft MPI pada kumpulan komputer virtual Windows H16r

Untuk menjalankan aplikasi Windows MPI pada kumpulan simpul komputer virtual Azure H16r, Anda perlu mengonfigurasi ekstensi HpcVmDrivers dan memasang Microsoft MPI. Berikut adalah langkah-langkah sampel untuk menyebarkan gambar Windows Server 2016 kustom dengan driver dan perangkat lunak yang diperlukan:

  1. Sebarkan komputer virtual Azure H16r yang menjalankan Windows Server 2016. Misalnya, buat komputer virtual di wilayah US Barat.
  2. Tambahkan ekstensi HpcVmDrivers ke komputer virtual dengan menjalankan perintah Azure PowerShell dari komputer klien yang tersambung ke langganan Azure Anda, atau menggunakan Azure Cloud Shell.
  3. Membuat koneksi Desktop Jarak Jauh ke komputer virtual.
  4. Unduh paket penyiapan (MSMpiSetup.exe) untuk versi terbaru Microsoft MPI, dan pasang Microsoft MPI.
  5. Ikuti langkah-langkah untuk membuat gambar Azure Compute Gallery untuk Batch.
  6. Dengan menggunakan API Batch atau portal Microsoft Azure, buat kumpulan menggunakan Azure Compute Gallery dan dengan jumlah node dan skala yang diinginkan. Tabel berikut ini memperlihatkan pengaturan kumpulan sampel untuk gambar:
Pengaturan Nilai
Jenis Gambar Gambar Kustom
Gambar Kustom Nama gambar
SKU agen simpul batch.node.windows amd64
Ukuran simpul Standar H16r
Komunikasi antar-simpul diaktifkan Benar
Tugas maks per simpul 1

Langkah berikutnya

  • Untuk menjalankan pekerjaan MPI di kumpulan Azure Batch, lihat contoh Windows atau Linux.