你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
规划 CycleCloud 生产部署
Azure CycleCloud 部署
- 确定将部署哪个版本的 CycleCloud:
- 通过定义 CycleCloud 服务器部署的订阅、vNet、子网和资源组来准备 Azure 订阅
- 定义哪个 资源组 将托管群集,或者 CycleCloud 应创建群集 (默认设置)
- 创建用于保险箱访问的存储帐户
- 确定 SSH 密钥、AD 或 LDAP 是否 用于身份验证
- 确定 CycleCloud 是否会使用服务主体或托管标识 (建议使用单个订阅,) 在服务主体和托管标识之间进行选择
- 确认哪个 SKU 将用于 CycleCloud:CycleCloud 系统要求
- 环境是否会部署在锁定的网络中? 如果是,请考虑到以下要求: 在锁定的网络中操作
- 部署 CycleCloud 服务器
警告
确保在创建存储帐户期间未设置 Azure Data Lake Storage Gen 2 的“启用分层命名空间”。 CycleCloud 无法使用已启用 ADLS Gen 2 的 Blob 存储作为存储保险箱。
Azure CycleCloud 配置
- 登录到 CycleCloud 服务器,创建站点和 CycleCloud 管理员帐户: CycleCloud 设置
- 创建指向存储帐户的 CycleCloud 保险箱
Azure CycleCloud 群集配置
- 定义对群集用户管理的用户访问权限
- 确定将使用哪个计划程序
- 确定计划程序/头节点需要哪个 SKU
- 确定计算/执行节点需要哪些 SKU。 这完全依赖于正在运行的应用程序
- 是否会使用模板或手动部署群集?
- 部署后,需要在计划程序上运行任何脚本或执行节点:
应用程序
- 应用程序具有哪些依赖项 (库等) ? 这些内容将如何提供?
- 应用程序安装和安装需要多长时间? 这可能确定应用程序如何提供给执行节点,并可能需要自定义映像。
- 是否需要考虑任何许可证依赖项? 应用程序是否需要联系本地许可证服务器?
- 确定从何处执行应用程序,这将取决于安装时间和性能要求:
- 通过自定义映像:
- 使用市场映像
- 从 NFS 共享、Blob 存储、Azure NetApp 文件
- 是否有特定的 VM SKU 需要用于运行的应用程序? MPI 是否是必需的,因为它需要一系列不同的计算机,如 H 系列?
- 每个应用程序每个作业的最佳核心数是多少?
- 是否可以使用现成 VM? 在 CycleCloud 中使用现成 VM
- 确保 订阅配额 已到位,以满足应用程序的核心要求
数据
- 确定 Azure 中的输入数据所在的位置。 这取决于应用程序和数据大小的性能。
- 在本地执行节点上
- 从 NFS 共享
- 在 Blob 存储中
- 使用 Azure NetApp 文件
- 确定输出数据是否需要处理后处理
- 确定处理完成后输出数据将驻留在何处
- 是否需要将它复制到其他位置?
- 存在哪些存档/备份要求?
作业提交
- 用户如何提交作业?
- 他们是否会有一个脚本在计划程序 VM 上运行,或者是否有前端来帮助数据上传和作业提交?
备份和灾难恢复
- 模板是否会用于群集创建? 这将使 CycleCloud 服务器在部署中更快、更一致地进行娱乐
- 灾难恢复有哪些要求? 如果 Azure 区域未按预期提供,业务会发生什么情况?
- 内部业务是否定义了任何应用程序 SLA?
- 另一个区域是否可以用作备用区域?
- 作业是否长时间运行? 检查点会很有用吗?