你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure CycleCloud 是一套企业级友好的工具,用于协调和管理 Azure 上的高性能计算 (HPC) 环境。 使用 CycleCloud,用户可以为 HPC 系统预配基础结构、部署熟悉的 HPC 计划程序,并自动缩放基础结构以在任何规模高效运行作业。 通过 CycleCloud,用户可以创建不同类型的文件系统,并将其装载到计算群集节点以支持 HPC 工作负荷。
Azure CycleCloud 适用于 HPC 管理员和想要使用特定计划程序设置 HPC 环境的用户。 它支持常用的计划程序,如 Slurm、PBSPro、LSF、网格引擎和 HT-Condor。 CycleCloud 是 Azure Batch 的妹妹产品,它提供计划程序作为 Azure 上的服务。
有关 CycleCloud 与其他 Azure HPC 解决方案的比较方式的信息 ,请参阅 Azure 上的高性能计算(HPC )。
为何应使用 Azure CycleCloud?
具有长期 HPC 环境的组织通常围绕特定计划程序构建深入的专业知识和自定义工具。 在 Azure 上移动或重新设计这些配置可能会让人感到无所适从。 CycleCloud 抽象化了基本的 Azure 构建基块,例如虚拟机(VM)、规模集、网络接口和磁盘,从而使 HPC 管理员能够专注于熟悉的:一个包含节点和可配置计划程序的 HPC 群集。
CycleCloud 将自动缩放插件添加到受支持的计划程序。 这意味着用户不需要生成复杂的自动缩放例程, 他们只需使用他们已知道的计划程序设置即可。
CycleCloud 具有丰富的声明性模板化格式,提供了强大的工具,用于在 Azure 上构建完整的 HPC 环境。 用户可以通过单个管理平面部署包括 NFS 服务器、并行文件系统、登录主机、许可证服务器和目录服务的环境,本质上是 HPC 系统所需的所有组件。
CycleCloud 与 Azure 服务(如 Azure Monitor 和 Azure 成本管理工具)集成。
CycleCloud 功能
能力 | 图片 |
---|---|
与计划程序无关 使用标准 HPC 计划程序(如 Slurm、PBS Pro、LSF、网格引擎和 HTCondor)或扩展 CycleCloud 自动缩放插件来处理自己的计划程序 |
![]() |
管理计算资源 管理虚拟机和规模集,以提供一组灵活的计算资源,以满足动态工作负荷要求 |
![]() |
自动缩放资源 根据作业负载、可用性和时间要求自动调整群集大小和组件 |
![]() |
监视和分析 使用可视化工具收集和分析性能数据 |
![]() |
模板群集 使用 CycleCloud 模板与社区共享群集拓扑 |
![]() |
自定义和扩展功能 使用综合 RESTful API 自定义和扩展功能,部署您自己的调度程序,并将其集成到现有的工作负载管理器中。 |
![]() |
集成到现有工作流中 使用内置 CLI 集成到现有工作流和工具中 |
![]() |
能力 | 图片 |
---|---|
与计划程序无关 使用标准 HPC 计划程序(如 Slurm、PBS Pro、LSF、网格引擎和 HTCondor)或扩展 CycleCloud 自动缩放插件来处理自己的计划程序 |
![]() |
管理计算资源 管理虚拟机和规模集,以提供一组灵活的计算资源,以满足动态工作负荷要求 |
![]() |
自动缩放资源 根据作业负载、可用性和时间要求自动调整群集大小和组件 |
![]() |
监视和分析 使用可视化工具收集和分析性能数据 |
![]() |
模板群集 使用 CycleCloud 模板与社区共享群集拓扑 |
![]() |
自定义和扩展功能 使用综合 RESTful API 自定义和扩展功能,部署您自己的调度程序,并将其集成到现有的工作负载管理器中。 |
![]() |
集成到现有工作流中 使用内置 CLI 集成到现有工作流和工具中 |
![]() |
如何使用 Azure CycleCloud?
Azure CycleCloud 是可在本地或 Azure VM 中运行的可安装 Web 应用程序。 安装后,可以将 CycleCloud 配置为在准备好的 Azure 订阅中使用计算和数据资源。 CycleCloud 为计划程序(PBSPro、LSF、网格引擎、Slurm、HTCondor)和文件系统(NFS、BeeGFS)提供了许多官方群集模板。 CycleCloud 社区提供的群集模板也可用。 可以使用这些未修改的群集模板,也可以根据特定需求对其进行自定义。
创建群集后,默认情况下会自动将其配置为自动缩放,以处理提交到计划程序的计算作业。 CycleCloud 管理功能可控制组织中其他用户对 CycleCloud 群集的访问。
借助模板和配置脚本,可以快速构建复杂的 HPC 环境,并为整个组织的不同团队复制这些设置。
CycleCloud 不能做什么?
CycleCloud 中没有作业计划功能。 换句话说,CycleCloud 不是计划程序,而是一个平台,使用户能够将自己的计划程序部署到 Azure。 CycleCloud 附带了对许多常用计划程序(PBSPro、Slurm、IBM LSF、网格引擎和 HTCondor)的内置支持,但 CycleCloud 用户经常在提供的自动缩放 API 的基础上实现自己的计划程序。
CycleCloud 不会将你锁定到特定的群集拓扑中。 它包含模板,可帮助你快速在 Azure 上启动 HPC 系统,并且可以自定义这些模板以满足你的需求。 Azure HPC 社区提供针对不同类型的工作负载和行业进行了优化的预设模板。
CycleCloud 部署环境的外观
可以在 Azure 基础结构上部署整个 CycleCloud HPC 系统。 CycleCloud 本身作为应用程序服务器安装在 Azure 中的 VM 上,需要对 Azure 资源提供程序 API 进行出站访问。 CycleCloud 启动和管理构成 HPC 系统的 VM。 这些节点通常包括计划程序头节点和计算节点。 还可以根据需要添加其他组件,例如 NFS 服务器、BeeGFS 群集、登录节点或堡垒主机。 完整设置在 CycleCloud 模板中定义。 还可以连接到 Azure 服务,例如 NetApp 文件、HPC 缓存和Microsoft Entra ID 服务。