简介
Azure CycleCloud 允许你在 Azure 中自定义和管理高性能计算 (HPC) 群集。
场景
Contoso 是一家位于德克萨斯州休斯顿的海洋和气象服务公司。 Contoso 的研究团队在很大程度上依赖于其本地 HPC 群集来运行基于 Slurm 的作业。
有一个新启动的项目涉及多项模拟,这些模拟将跟踪飓风季穿过美国墨西哥湾海岸的风暴。 遗憾的是,初始评估确定现有的本地 HPC 群集没有足够的计算容量来运行模拟。
作为首席研究工程师,你使用 Contoso 的现有 Azure 订阅在 Azure 中预配了一个新的 HPC 群集。 为了简化预配过程,你实施了 Azure CycleCloud 并使用它来部署新群集。
现在,你必须自定义部署,以针对新项目对其进行优化。 你已在本地 HPC 环境中使用了现有的自定义映像和脚本。 你希望在预配计划程序和计算节点时重用这些映像和脚本。 你还在探索用于简化部署过程的选项,因为你计划配置匹配的开发和生产群集。 你计划使用 Azure CycleCloud 的功能来实现这些目标。
我们将执行哪些操作?
本模块的第一项任务是,使用自定义的 Azure CycleCloud 模板来测试实现群集的过程。 为此,你将从 Azure CycleCloud 模板 GitHub 存储库下载现有模板,更改模板中存储配置的定义,导入新修改的模板,并使用 Azure CycleCloud 图形界面创建群集。
接下来,你将使用同一模板在群集定义中添加额外的节点数组和分区,确保相应的群集资源可通过 Azure CycleCloud Web 界面进行配置,导出新部署的群集的属性,使用新配置的设置对其进行更新,并导入修改后的模板以将其配置应用于现有群集。
最后,你将实现一个用于 Azure CycleCloud 的 cloud-init 脚本。 你将首先将该脚本添加到计划程序和计算节点,然后启动群集以验证是否发生了 cloud-init 更改。
主要目标是什么?
完成本模块后,你将详细了解如何使用 Azure CycleCloud 模板自定义在 Azure 中运行的 HPC 群集的体系结构。 你还将了解如何使用 cloud-init 脚本修改群集节点的配置。