你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

规划 CycleCloud 生产部署

Azure CycleCloud 部署

警告

确保在创建存储帐户期间未设置 Azure Data Lake Storage Gen 2 的“启用分层命名空间”。 CycleCloud 无法使用已启用 ADLS Gen 2 的 Blob 存储作为存储保险箱。

Azure CycleCloud 配置

Azure CycleCloud 群集配置

  • 定义对群集用户管理的用户访问权限
  • 确定将使用哪个计划程序
  • 确定计划程序/头节点需要哪个 SKU
  • 确定计算/执行节点需要哪些 SKU。 这完全依赖于正在运行的应用程序
  • 是否会使用模板或手动部署群集?
  • 部署后,需要在计划程序上运行任何脚本或执行节点:

应用程序

  • 应用程序具有哪些依赖项 (库等) ? 这些内容将如何提供?
  • 应用程序安装和安装需要多长时间? 这可能确定应用程序如何提供给执行节点,并可能需要自定义映像。
  • 是否需要考虑任何许可证依赖项? 应用程序是否需要联系本地许可证服务器?
  • 确定从何处执行应用程序,这将取决于安装时间和性能要求:
  • 是否有特定的 VM SKU 需要用于运行的应用程序? MPI 是否是必需的,因为它需要一系列不同的计算机,如 H 系列?
  • 每个应用程序每个作业的最佳核心数是多少?
  • 是否可以使用现成 VM? 在 CycleCloud 中使用现成 VM
  • 确保 订阅配额 已到位,以满足应用程序的核心要求

数据

  • 确定 Azure 中的输入数据所在的位置。 这取决于应用程序和数据大小的性能。
    • 在本地执行节点上
    • 从 NFS 共享
    • 在 Blob 存储中
    • 使用 Azure NetApp 文件
  • 确定输出数据是否需要处理后处理
  • 确定处理完成后输出数据将驻留在何处
  • 是否需要将它复制到其他位置?
  • 存在哪些存档/备份要求?

作业提交

  • 用户如何提交作业?
  • 他们是否会有一个脚本在计划程序 VM 上运行,或者是否有前端来帮助数据上传和作业提交?

备份和灾难恢复

  • 模板是否会用于群集创建? 这将使 CycleCloud 服务器在部署中更快、更一致地进行娱乐
  • 灾难恢复有哪些要求? 如果 Azure 区域未按预期提供,业务会发生什么情况?
  • 内部业务是否定义了任何应用程序 SLA?
  • 另一个区域是否可以用作备用区域?
  • 作业是否长时间运行? 检查点会很有用吗?