你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure Batch 和可靠性
Azure Batch 允许你在 Azure 中高效运行大规模并行和高性能计算 (HPC) 批处理作业。
使用 Azure Batch 执行以下操作:
- 创建和管理计算节点池(虚拟机)。
- 安装要运行的应用程序。
- 安排要在计算节点上运行的作业。
以下部分包括 Azure Batch 专用的设计和配置清单、建议设计和配置选项。
设计和配置清单
“设计工作负荷和配置 Azure Batch 时,你是否考虑到复原能力?”
- 持续更新所有区域中的应用程序二进制文件和引用数据。
- 使用更少的作业和更多的任务。
- 如果某个 Azure Batch 帐户变得不可用,在不同区域中使用多个 Batch 帐户可以使你的应用程序继续运行。
- 生成持久任务。
- 在每个区域预先创建所有必需的服务,例如 Batch 帐户和存储帐户。
- 确保提前在所有订阅上设置适当配额,这样就能够使用 Batch 帐户分配必需的核心数。
设计和配置建议
浏览以下建议表格,以优化工作负载设计和 Azure Batch 配置,实现服务可靠性:
建议 | 说明 |
---|---|
持续更新所有区域中的应用程序二进制文件和引用数据。 | 持续更新可确保该区域能够快速联机,而无需等待文件上传和部署。 |
使用更少的作业和更多的任务。 | 使用一个作业运行单个任务是低效的做法。 例如,相比创建 100 个每个作业包含 10 个任务的作业,使用包含 1000 个任务的单个作业更为有效。 运行 1000 个作业(每个作业只包含一个任务)是效率最低、速度最慢且成本最高的方法。 |
如果某个 Azure Batch 帐户变得不可用,在不同区域中使用多个 Batch 帐户可以使你的应用程序继续运行。 | 对于可用性高的应用程序而言,拥有多个帐户至关重要。 |
生成持久任务。 | 任务应设计为可承受故障并允许重试,尤其是对于长期运行的任务。 确保任务即使多次运行也能生成相同的单一结果。 实现此目的方法之一是让任务进行“目标搜索”。 另一种方法是确保你的任务具有“幂等性”(无论任务运行多少次,都生成相同的结果)。 |
在每个区域预先创建所有必需的服务,例如 Batch 帐户和存储帐户。 | 创建帐户通常不收取任何费用,并且只有在使用帐户或存储数据时才会产生费用。 |
提示
有关负载均衡器可靠性指南的详细信息,请参阅Azure Batch可靠性。