介绍
Azure CycleCloud 应用程序提供了一种简单、安全且可缩放的方式在 Azure 中创建、自定义和管理高性能计算 (HPC) 群集。
场景
Contoso, Ltd. 是一家位于德克萨斯州休斯顿的海洋和气象服务公司。 其研究团队非常依赖本地于 HPC 群集来运行基于 Slurm 的任务。
新启动的项目涉及多个模拟,这些模拟将跟踪飓风季穿过美国墨西哥湾海岸的风暴。 遗憾的是,初始评估确定现有的本地 HPC 群集没有足够的计算容量来运行模拟。
作为首席研究工程师,你想要使用 Contoso 的现有 Azure 订阅来预配新的 HPC 群集。 为了使用团队的技术专业知识,你需要确保 Azure 中部署的群集与本地群集的体系结构和软件堆栈完全匹配。 同时,你需要考虑管理团队的指令,他们强调将群集成本控制在项目预算内非常重要。
你开始了解在 Azure 中部署、操作和监视 HPC 群集的选项。 为了简化这些任务,你决定评估 Azure CycleCloud 的功能。
我们该怎么做?
在此模块中,你将首先部署托管 Azure CycleCloud 应用程序的 Azure VM,并对其进行配置以与 Azure 订阅结合使用。 然后,使用新部署的 Azure CycleCloud 应用程序的图形界面,基于内置 Slurm 模板创建 HPC 群集,然后验证其基本功能。 为了遵守管理团队的指令,你还需要配置预算警报、在完成评估后终止群集,并删除在此模块期间预配的所有资源,以避免任何不必要的成本。
主要目标是什么?
完成本模块后,你将详细了解如何安装和配置 Azure CycleCloud,介绍它与非 Microsoft 计划程序的集成选项,并使用它在 Azure 中部署基本的 HPC 群集。