了解任务类型

在 HPC Pack 中,类型 任务属性有助于定义如何运行命令。 任务 类型 的默认值为 “基本”。 基本 任务运行一次命令。 其他任务类型创建每个运行命令实例的子任务。 一个任务最多可以包含 1,000,000 个子任务。

注意

在包含子任务的任务中,可以使用星号 “、” 字符作为参数扫描索引(在 参数扫描 任务中)或子任务 ID(在 服务节点准备节点发布 任务)的占位符。 可以包含多个星号 \ 来指示在表示索引或子任务数时要使用的最小位置数。 这不会限制需要更多位置的数字。 定义命令或任务的输入和输出文件时,此占位符非常有用。 有关详细信息和示例,请参阅包含子任务和星号的 任务

下表描述了属性值:

任务类型值 描述 操作说明
基本 运行串行应用程序或消息传递接口(MPI)应用程序的单个实例。 MPI 应用程序通常同时在多个核心上运行,并且可以跨多个节点。 定义基本或 MPI 任务
参数扫描 通常跨索引的输入和输出文件运行指定次数(按开始、结束和递增值指示)运行命令。 扫描的步骤可能或可能不会并行运行,具体取决于任务运行时群集上可用的资源。 定义参数扫描任务
节点准备 在分配给作业的每个计算节点上运行命令或脚本,即使节点是动态添加(增长策略)。 节点准备 任务在作业中的任何其他任务之前在节点上运行。

如果 节点准备 任务无法在节点上运行,则不会将该节点添加到作业。
定义节点准备任务
节点发布 在从作业释放的每个节点上运行命令或脚本,即使节点被动态删除(收缩策略)。

Node Release 任务的最大运行时间(以秒为单位),由群集管理员使用 NodeReleaseTaskTimeout 群集参数定义。 不能替代此运行时限制。 默认情况下,超时设置为 15 秒。 若要查看此群集参数的值,可以运行以下命令(搜索字符串区分大小写):cluscfg listparams|find “NodeReleaseTaskTimeout”

取消作业时运行节点发布 任务。 节点发布 在强制取消作业时不会运行任务。 注意: 如果作业具有最长的运行时和 节点发布 任务,则作业计划程序将在作业运行时过期之前取消作业中的其他任务(作业运行时 减去 节点发布任务运行时)。 这允许 节点发布 任务在作业的分配时间内运行。
定义 Node ReleaseTask
服务 对分配给作业的所有资源运行命令或服务。 将新资源添加到作业时,或者以前正在运行的实例退出并且正在运行的资源仍分配给作业时,该命令的新实例将运行。 服务 任务继续启动实例,直到作业被取消或停止、最长运行时间过期或达到最大实例数(子任务)为止。

通过面向服务的体系结构(SOA)客户端提交的任务作为 服务 任务运行。

不能将 基本 任务或 参数扫描 任务添加到包含 服务 任务的作业。
定义服务任务

以下任务属性不适用于按资源启动的任务,并且不能在 节点准备节点发布服务 任务上设置这些任务:

  • 核心数、套接字、节点数

  • 所需的节点

  • 独家

  • 可重新运行

  • 取决于 (任务依赖项)

  • 参数扫描设置

其他参考