在啟用 InfiniBand 的 HB 系列和 N 系列 VM 上的高效能運算
適用於: ✔️ Linux VM ✔️ Windows VM ✔️ 彈性擴展集 ✔️ 統一擴展集
Azure 已啟用 InfiniBand 的 H 系列和 N 系列 VM 的設計訴求是為各種真實世界的 HPC 和 AI 工作負載提供領導層級的效能、訊息傳遞介面 (MPI) 可擴縮性和成本效益。 這些經過高效能運算 (HPC) 最佳化的 VM 是用來解決科學和工程領域中一些最需要密集運算的問題,例如流體動力學、地球建模、氣象模擬等等。
這些文章說明如何在 Azure 上開始使用已啟用 InfiniBand 的 H 系列和 N 系列 VM,以及如何在 VM 上以最佳方式設定 HPC 和 AI 工作負載以達成可擴縮性。
特性與功能
啟用 InfiniBand 的 HB 系列和 N 系列 VM 的設計訢求是為 HPC 工作負載提供最佳的 HPC 效能、MPI 可擴縮性和成本效益。 若要深入了解 VM 的特性和功能,請參閱 HB 系列和 N 系列 VM。
RDMA 和 InfiniBand
支援 RDMA 的 HB 系列和 N 系列 VM 會透過低延遲和高頻寬的網路進行通訊。 這類互連的 RDMA 功能對於提升分散式節點 HPC 和 AI 工作負載的可擴縮性和效能非常重要。 啟用 InfiniBand 的 H 系列和 N 系列的 VM 是非封鎖式的寬大樹狀結構,並具備低直徑設計,以獲得最佳且一致的 RDMA 效能。 請參閱啟用 InfiniBand 以深入了解如何在啟用 InfiniBand 的 VM 上設定 InfiniBand。
訊息傳遞介面
啟用 SR-IOV 的 HB 系列和 N 系列支援幾乎所有 MPI 程式庫和版本。 其中一些最常用的 MPI 程式庫包括:Intel MPI、OpenMPI、HPC-X、MVAPICH2、MPICH、Platform MPI。 支援所有遠端直接記憶體存取 (RDMA) 動詞命令。 請參閱設定 MPI,以深入了解如何安裝各種支援的 MPI 程式庫及其最佳組態。
開始使用
第一個步驟是針對以 VM 規格為基礎的工作負載和 RDMA 功能,選取已進行最佳化的 HB 系列和 N 系列 VM 類型。 第二,啟用 InfiniBand 來設定 VM。 有各種方法可以執行這項作業,包括使用最佳化的 VM 映像搭配驅動程式內建聲場模擬。如需詳細資訊,請參閱 Linux 優化和啟用 InfiniBand。 第三,若是分散式節點工作負載,請務必選擇並適當設定 MPI。 如需詳細資訊,請參閱設定 MPI。 第四,為獲得效能和可擴縮性,請遵循 VM 系列的特定指引來以最佳方式設定工作負載,例如 HBv3 系列概觀和 HC 系列概觀。
下一步
- 了解設定和最佳化已啟用 InfiniBand 的 HB 系列和 N 系列 VM。
- 請檢閱 HBv3 系列概觀和 HC 系列概觀,了解如何以最佳方式設定工作負載以獲得效能和可擴縮性。
- 請參閱 Azure 計算技術社群部落格的最新公告、HPC 工作負載範例和效能結果。
- 使用最佳化 Azure 上的 HPC 應用程式學習課程模組來測試您的知識。
- 如需執行中 HPC 工作負載較高階的架構檢視,請參閱 Azure 上的高效能運算 (HPC)。