
Azure 上的電腦輔助工程服務
為 Azure 上的電腦輔助工程 (CAE) 提供軟體即服務 (SaaS) 平台。
高效能運算 (HPC) 也稱為「巨量計算」,會使用大量 CPU 或 GPU 型電腦來解決複雜的數學工作。
許多產業都使用 HPC 來解決一些最困難的問題。 這些產業包括下列工作負載:
內部部署 HPC 系統與雲端中的其中一個主要差異,就是能夠視需要動態新增和移除資源。 動態調整會因為瓶頸而移除計算功能,改而讓客戶能夠針對其作業需求適度調整其基礎結構的大小。
下列文章提供此動態調整功能的詳細說明。
當您想要在 Azure 上實作自己的 HPC 解決方案時,請確定您已檢閱下列主題:
建置 HPC 系統需要許多基礎結構元件。 不論您選擇如何管理 HPC 工作負載,計算、儲存體和網路都會提供基礎元件。
在 Azure 上設計和實作 HPC 架構的方式有很多種。 HPC 應用程式可擴展成上千個計算核心,以擴充內部部署叢集或以 100% 雲端原生解決方案的方式執行。
下列案例概述幾個常見的 HPC 解決方案建置方式。
為 Azure 上的電腦輔助工程 (CAE) 提供軟體即服務 (SaaS) 平台。
在 Azure 上執行計算流體力學 (CFD) 模擬。
使用 Azure Batch 服務在 Azure 中執行原生 HPC 工作負載
Azure 提供一系列的大小,可針對兩個 CPU & GPU 密集工作負載進行優化。
N 系列 VM 功能 NVIDIA GPU 是專為需要大量運算或需要大量圖形的應用程式所設計,包括人工地智慧 (AI) 學習和視覺效果。
大規模 Batch 和 HPC 工作負載所需要的資料儲存和存取會超過傳統雲端檔案系統的容量。 有許多解決方案可管理 Azure 上 HPC 應用程式的速度和容量需求:
如需比較 Azure 上 Lustre、GlusterFS 和 BeeGFS 的詳細資訊,請檢閱 Azure 電子書上的平行檔案系統 和 Azure 部落格 上的 Lustre 。
H16r、H16mr、A8 和 A9 VM 可以連線到高輸送量後端 RDMA 網路。 此網路可以改善 Microsoft MPI 或 Intel MPI 下執行的緊密結合平行應用程式效能。
從頭開始在 Azure 上建置 HPC 系統可提供大量的彈性,但通常需要大量維護。
如果您有想要連線到 Azure 的現有內部部署 HPC 系統,有數個資源可協助您開始使用。
首先,檢閱文件中的將內部部署網路連線到 Azure 的選項一文。 您可以在該處找到這些連線選項的其他資訊:
此參考架構會示範如何使用網站對網站虛擬私人網路 (VPN),將內部部署網路擴充至 Azure。
ExpressRoute 連線會透過第三方連線提供者,使用私人的專用連線。 私人連線會將內部部署網路延伸到 Azure。
跨越使用 ExpressRoute 搭配 VPN 閘道容錯移轉連線的 Azure 虛擬網路與內部部署網路,實作可用性高且安全的站對站網路架構。
安全地建立網路連線後,您即可透過現有工作負載管理員的負載平衡功能,開始隨選使用雲端計算資源。
Azure Marketplace中提供許多工作負載管理員。
Azure Batch 是一項平台服務,可用於在雲端有效地執行大規模的平行和高效能運算 (HPC) 應用程式。 Azure Batch 可排程要在受控集區虛擬機器上執行的需要大量運算工作,而且可以調整運算資源以符合工作的需求。
SaaS 提供者或開發人員可使用 Batch SDK 和工具,將 HPC 應用程式或容器工作負載與 Azure 進行整合、將資料暫存至 Azure,並建置作業執行管線。
Azure CycleCloud 在 Azure 上使用任何作業排程器 (如 Slurm、Grid Engine、HPC Pack、HTCondor、LSF、PBS Pro 或 Symphony) 管理 HPC 工作負載的最簡單方法
CycleCloud 可讓您:
下列是可以在 Azure 基礎結構中執行的叢集和工作負載管理員範例。 在 Azure VM 中建立獨立叢集,或從內部部署叢集高載至 Azure VM。
容器也可用來管理一些 HPC 工作負載。 Azure Kubernetes Service (AKS) 等服務可讓您輕鬆地在 Azure 中部署受控 Kubernetes 叢集。
您可以透過一些不同方法在 Azure 上管理您的 HPC 成本。 確定您已檢閱 Azure 購買選項,以尋找最適合貴組織的方法。
如需 Azure 上的安全性最佳做法概觀,請檢閱 Azure 安全性文件。
除了 Cloud Bursting 區段中可用的網路設定之外,您還可以實作中樞/輪輻設定來隔離您的計算資源:
「中樞」是 Azure 中的虛擬網路 (VNet),可當作內部部署網路的連線中心點。 輪輻是與中樞對等的 VNet,可用於隔離工作負載。
此參考架構是建置在中樞輪輻參考架構基礎上,以包含可以被所有輪輻取用之中樞中的共用服務。
在 Azure 中執行自訂或商業 HPC 應用程式。 本節中的數個範例會經過基準測試,以使用其他 VM 或運算核心有效地進行擴充。 請瀏覽 Azure Marketplace 以取得可立即部署的解決方案。
注意
請向廠商確認任何商業應用程式在雲端中的執行授權或其他限制。 並非所有廠商都提供隨用隨付授權。 您可能需要視您的解決方案,在雲端中授權伺服器,或連線至內部部署授權伺服器。
在與 HPC 輸出相同的區域中執行 GPU 支援的虛擬機器,以達到最低延遲、存取,以及透過 Azure 虛擬桌面、Citrix 或 VMware Horizon 從遠端視覺化。
在 Azure 上使用 Citrix 建置適用于 Linux 桌面的 VDI 環境。
在 Azure 上使用 Azure 虛擬桌面建置適用于 Windows 桌面的 VDI 環境。
有許多客戶已針對其 HPC 工作負載使用 Azure 來獲得絕佳的成功。 您可以在底下找到這些客戶的一些案例研究:
如需最新的公告,請參閱下列資源:
這些教學課程會提供您在 Microsoft Batch 上執行應用程式的詳細資料: