H 系列和 N 系列 VM 上啟用 InfiniBand 的高效能運算

適用于: ✔️ Linux vm ✔️ Windows vm ✔️彈性擴展集✔️統一擴展集

Azure 已啟用 InfiniBand 的 H 系列和 N 系列 VM 的設計訴求是為各種真實世界的 HPC 和 AI 工作負載提供領導層級的效能、訊息傳遞介面 (MPI) 可擴縮性和成本效益。 這些經過高效能運算 (HPC) 最佳化的 VM 是用來解決科學和工程領域中一些最需要密集運算的問題,例如流體動力學、地球建模、氣象模擬等等。

這些文章說明如何在 Azure 上開始使用已啟用 InfiniBand 的 H 系列和 N 系列 VM,以及如何在 VM 上以最佳方式設定 HPC 和 AI 工作負載以達成可擴縮性。

功能

啟用 InfiniBand 的 H 系列和 N 系列 VM 的設計訢求是為 HPC 工作負載提供最佳的 HPC 效能、MPI 可擴縮性和成本效益。 若要深入了解 VM 的特性和功能,請參閱 H 系列N 系列 VM。

RDMA 和 InfiniBand

支援 RDMAH 系列N 系列vm 會透過低延遲和高頻寬的可感知網路進行通訊。 這類互連的 RDMA 功能對於提升分散式節點 HPC 和 AI 工作負載的可擴縮性和效能非常重要。 啟用 InfiniBand 的 H 系列和 N 系列的 VM 是非封鎖式的寬大樹狀結構,並具備低直徑設計,以獲得最佳且一致的 RDMA 效能。 請參閱啟用 InfiniBand 以深入了解如何在啟用 InfiniBand 的 VM 上設定 InfiniBand。

訊息傳遞介面

啟用 SR-IOV 的 H 系列和 N 系列支援幾乎所有 MPI 程式庫和版本。 某些最常用的 MPI 程式庫為: Intel MPI、OpenMPI、HPC-X、MVAPICH2、MPICH、Platform MPI。 支援 (RDMA) 動詞的所有遠端直接記憶體存取。 請參閱設定 MPI,以深入了解如何安裝各種支援的 MPI 程式庫及其最佳組態。

開始使用

第一個步驟是針對以 VM 規格為基礎的工作負載和 RDMA 功能,選取已進行最佳化的 H 系列N 系列 VM 類型。 第二,啟用 InfiniBand 來設定 VM。 有各種方法可以執行這項作業,包括使用最佳化的 VM 映像搭配驅動程式內建聲場模擬。如需詳細資訊,請參閱 Linux 優化啟用 InfiniBand。 第三,針對分散式節點工作負載,適當地選擇和設定 MPI 是很重要的。 如需詳細資訊,請參閱設定 MPI。 第四,針對效能和擴充性,請遵循 VM 系列專屬的指引,以最佳方式設定工作負載,例如 HBv3 系列總覽HC 系列的總覽

後續步驟