在啟用 InfiniBand 的 HB 系列和 N 系列 VM 上的高效能運算

適用於: ✔️ Linux VM ✔️ Windows VM ✔️ 彈性擴展集 ✔️ 統一擴展集

Azure 已啟用 InfiniBand 的 H 系列和 N 系列 VM 的設計訴求是為各種真實世界的 HPC 和 AI 工作負載提供領導層級的效能、訊息傳遞介面 (MPI) 可擴縮性和成本效益。 這些經過高效能運算 (HPC) 最佳化的 VM 是用來解決科學和工程領域中一些最需要密集運算的問題,例如流體動力學、地球建模、氣象模擬等等。

這些文章說明如何在 Azure 上開始使用已啟用 InfiniBand 的 H 系列和 N 系列 VM,以及如何在 VM 上以最佳方式設定 HPC 和 AI 工作負載以達成可擴縮性。

特性與功能

啟用 InfiniBand 的 HB 系列和 N 系列 VM 的設計訢求是為 HPC 工作負載提供最佳的 HPC 效能、MPI 可擴縮性和成本效益。 若要深入了解 VM 的特性和功能,請參閱 HB 系列N 系列 VM。

RDMA 和 InfiniBand

支援 RDMAHB 系列N 系列 VM 會透過低延遲和高頻寬的網路進行通訊。 這類互連的 RDMA 功能對於提升分散式節點 HPC 和 AI 工作負載的可擴縮性和效能非常重要。 啟用 InfiniBand 的 H 系列和 N 系列的 VM 是非封鎖式的寬大樹狀結構,並具備低直徑設計,以獲得最佳且一致的 RDMA 效能。 請參閱啟用 InfiniBand 以深入了解如何在啟用 InfiniBand 的 VM 上設定 InfiniBand。

訊息傳遞介面

啟用 SR-IOV 的 HB 系列和 N 系列支援幾乎所有 MPI 程式庫和版本。 其中一些最常用的 MPI 程式庫包括:Intel MPI、OpenMPI、HPC-X、MVAPICH2、MPICH、Platform MPI。 支援所有遠端直接記憶體存取 (RDMA) 動詞命令。 請參閱設定 MPI,以深入了解如何安裝各種支援的 MPI 程式庫及其最佳組態。

開始使用

第一個步驟是針對以 VM 規格為基礎的工作負載和 RDMA 功能,選取已進行最佳化的 HB 系列N 系列 VM 類型。 第二,啟用 InfiniBand 來設定 VM。 有各種方法可以執行這項作業,包括使用最佳化的 VM 映像搭配驅動程式內建聲場模擬。如需詳細資訊,請參閱 Linux 優化啟用 InfiniBand。 第三,針對分散式節點工作負載,選擇並適當設定 MPI 是很重要的。 如需詳細資訊,請參閱設定 MPI。 第四,為獲得效能和可擴縮性,請遵循 VM 系列的特定指引來以最佳方式設定工作負載,例如 HBv3 系列概觀HC 系列概觀

下一步