使用 Microsoft HPC Pack 部署 Azure 节点的步骤

本主题介绍在运行 HPC Pack 的群集中的“突发”方案中部署 Azure 节点的整个过程。

注意

从 HPC Pack 2008 R2 Service Pack 1 开始,支持添加 Azure 节点。

先决条件

在 Windows HPC 群集中部署 Azure 节点之前,请确保以下各项:

  • 群集和网络环境满足部署 Azure 节点的要求

  • 可以访问 Azure 订阅

  • Azure 订阅配置了方案所需的管理证书、云服务、存储帐户和其他 Azure 功能

有关详细信息,请参阅以下主题:

注意

如果计划部署大量 Azure 节点,则可能需要在本地群集环境和 Azure 订阅中进行其他配置。 有关详细信息,请参阅 使用 Microsoft HPC Pack 进行 Azure 节点大型部署的最佳做法

步骤 1:创建 Azure 节点模板

若要创建 Azure 节点模板,请使用 HPC 群集管理器中的“创建节点模板向导”。

Azure 节点模板包含以下配置信息:

  • Azure 订阅中用于将一组 Azure 节点添加到群集的信息。 此信息至少包括 Azure 订阅 ID、Azure 管理证书的证书指纹、Azure 云服务的名称和存储帐户的名称。 有关详细信息,请参阅 了解 Microsoft HPC Pack 的 Azure 订阅信息

  • (可选)用于启用 HPC Pack 版本支持的其他 Azure 功能的设置。 有关配置这些附加设置的详细信息,请参阅 为 Microsoft HPC Pack 配置 Azure Node 模板

    注意

    如果 HPC Pack 版本支持,则必须在 Azure 订阅中预配置某些 Azure 功能(例如 Azure 虚拟网络),然后才能在 Azure 节点模板中配置这些功能。

  • 节点的可用性策略-即,在从 Azure 云服务) 中删除角色实例 () , (预配 Azure 角色实例并停止 Azure 节点 (启动的方式和时间。 有关详细信息,请参阅 了解 Azure 节点可用性策略

创建 Azure 节点模板

  1. 启动 HPC 群集管理器。

  2. “配置”导航窗格中,单击“ 节点模板”。

  3. “操作 ”窗格中,单击“ 新建”。 此时会显示“创建节点模板向导”。

  4. 在“选择节点模板类型”页上,单击“Azure 节点模板”,并单击“下一步”。

  5. “指定模板名称 ”页上,键入节点模板的名称,并根据需要键入其说明。 单击 “下一步”

  6. “提供订阅信息 ”页上,提供 Azure 订阅中用于添加节点的以下信息:

    1. “订阅 ID ”文本框中,键入或粘贴有效的 Azure 订阅帐户的 ID。

    2. “管理证书 ”文本框中,键入、粘贴或浏览到具有私钥的证书指纹,该私钥位于计算机上的相应证书存储区中。 然后单击“下一步”。

      注意

      • 指纹必须标识与 Azure 订阅中配置的管理证书相对应的私钥证书。
      • 如果键入或粘贴指纹,请确保删除所有空格。
      • 如果单击“ 浏览”,将显示可用服务器身份验证证书的列表,包括可能已在计算机上配置的证书。 在列表中选择一个名称以添加相应的指纹。
      • 如果之前配置了安装 HPC Pack 时在头节点上自动生成的证书,请单击“ 浏览 ”,然后选择“ 默认 Microsoft HPC Azure 管理”。 有关使用 默认 Microsoft HPC Azure 管理 证书的信息,请参阅 为 Azure 突发部署配置 Azure 管理证书的选项
      • 如果在列表中看不到所需的证书,或者所选证书出现错误,请参阅 排查证书问题

      重要

      如果头节点上运行的服务无法连接到 Azure,你可能会看到类似于 The remote server returned an error: (403) Forbidden的错误消息。 这可能表示网络防火墙的配置、头节点上的管理证书或与网络防火墙通信的代理客户端存在问题。 若要确保已正确配置 HPC Pack 以与 Azure 通信,请参阅 使用 Microsoft HPC Pack 添加 Azure 节点的要求

  7. “提供服务信息 ”页上,选择下拉列表中显示的 Azure 云服务名称和存储帐户名称。 单击 “下一步”

  8. 根据安装的 HPC Pack 版本,可以在模板中配置其他 Azure 设置,例如远程桌面凭据或 Azure 虚拟网络的名称。 有关这些附加设置的详细信息,请参阅 为 Microsoft HPC Pack 配置 Azure Node 模板中的帮助主题。

  9. “配置 Azure 可用性策略 ”页上,选择希望 Azure 节点启动的方式 (这会在 Azure) 中预配角色实例并停止 (这会从 Azure) 中删除角色实例:

    1. 如果要手动启动和停止节点,请选择该选项,然后单击“ 下一步”。 转到此过程的最后一步。

    2. 如果希望节点启动 (并联机) 并自动停止,请选择该选项,然后单击“ 配置可用性策略”。 此时将显示“ 配置 Azure 可用性策略 ”对话框。

    3. 在“ 配置 Azure 可用性策略 ”对话框中,单击并拖动鼠标以选择要启动和停止节点的天数和小时。

    4. (可选)指定节点停止前的分钟数, () 节点上不会启动任何新作业。

    5. 若要保存设置,请单击“ 确定”,然后单击“ 下一步”。

      重要

      • 在某些情况下,部署 Azure 角色实例可能需要几分钟时间,删除实例也可能需要几分钟时间。
      • 如果选择自动启动和停止节点的选项,则除了希望节点可用于运行作业的时间外,还要在每个联机时间块中为节点部署计划额外的时间。 还应避免在短时间内计划联机时间段。
  10. 若要创建节点模板,请在“ 审阅 ”页上单击“ 创建”。

编辑 Azure 节点模板

  1. 在 HPC 群集管理器的“配置”中的导航窗格中,单击“节点模板”。

  2. 在“视图”窗格中,选择一个 Azure 节点模板。

  3. 在“操作”窗格中,单击“编辑”。 此时将显示“ 节点模板编辑器 ”对话框。

  4. 若要修改现有模板属性,可以指定模板名称和说明,或修改“ 连接信息 ”和其他选项卡上的其他设置。

  5. 若要验证 Azure 连接信息(例如云服务和存储帐户的名称),请在“ 连接信息 ”选项卡上单击“ 验证连接信息”。

  6. 编辑完模板后,单击“ 保存”。

其他注意事项

  • 若要在 Azure 节点模板中添加或验证订阅信息,必须具有 Internet 连接,并且必须正确配置 Azure 的管理证书。

  • 编辑连接信息不会影响已使用节点模板部署的 Azure 节点的连接设置。 只有稍后添加的节点才使用模板中的新连接信息。

  • 编辑 Azure 节点可用性策略会更改已使用节点模板添加到 HPC 群集的节点的策略,以及稍后添加的节点的策略。 例如,可以编辑 Azure 节点模板,以便配置为根据每周计划自动启动和停止的 Azure 节点现在配置为手动启动和停止。

    注意

    在现有 Azure 节点模板中配置自动可用性策略后,该策略不会立即影响当前在 Azure 中启动 (预配) 但处于脱机状态的节点。 如果在模板中配置的可用性间隔之一期间进行此更改,则处于脱机状态的预配节点在间隔期间将保持该状态。 这些节点将根据策略自动停止,但只会 (启动,并在后续可用性间隔开始时自动) 联机。

  • 根据 Azure 节点模板中可用性策略的配置和作业计划程序配置中的“任务取消宽限期”设置,Azure 节点停止和部署结束的确切时间可能与联机时间块的计划结束时间不同。 当 HPC 任务仍在接近联机时间块结束时,可能会发生这种情况。 有关详细信息,请参阅 了解 Azure 节点可用性策略

  • 可以将文件包上传到模板中指定的存储帐户。 例如,你可能想要上传将在节点上运行的应用程序或服务文件。 如果这样做,在 Azure 中部署角色实例时,包会自动安装在节点中。 有关打包文件并将其上传到存储帐户的详细信息,请参阅 hpcpack

第 2 步:向 Windows HPC 群集中添加 Azure 节点

创建 Azure 节点模板后,可以使用“添加节点向导”将节点添加到群集。

若要添加节点,请指定 Azure 节点模板和以下信息:

  • 节点数 启动节点时,将在 Azure 中部署的角色实例数。 确保该数字在 Azure 订阅中的角色实例配额范围内。

  • 节点的大小 Azure 中可与 HPC Pack 配合使用的辅助角色实例大小之一。 大小决定了每个角色实例的 CPU 核心数、内存容量和本地文件系统大小等特征。 有关详细信息,请参阅 可用于突发部署的 Azure 辅助角色实例大小

    注意

    从 HPC Pack 2012 R2 Update 1 开始,HPC Pack 会自动检测并允许你选择其他受支持的辅助角色大小(如果以后在 Azure 中引入)。

添加 Azure 节点

  1. 在 HPC 群集管理器的 “资源管理 ” (HPC Pack) 的某些版本中称为 “节点管理 ”的“ 操作 ”窗格中,单击“ 添加节点”。 此时将显示“添加节点向导”。

  2. “选择部署方法 ”页上,单击“ 添加 Azure 节点”,并单击“ 下一步”。

  3. “指定新节点 ”页上,选择节点模板,指定节点的数量和大小,然后单击“ 下一步”。

  4. 在“完成添加节点向导”页上,单击“完成”。

其他注意事项

  • 若要添加 Azure 节点,还可以使用 Add-HpcNodeSet HPC PowerShell cmdlet。

  • 添加后,Azure 节点将处于 “未部署” 状态,并且节点运行状况状态为“ 未批准”。 必须先启动它们 (预配) 然后联机,然后才能使用它们运行作业。 节点会根据节点模板中的指定,手动或自动启动并联机。

  • 使用特定节点模板添加到群集的所有 Azure 节点定义了一组节点,启动节点时,这些节点将在 Azure 中部署并可以一起管理。 这包括稍后使用相同的节点模板添加的 Azure 节点。

  • 有关详细信息,请参阅 添加 Azure 节点

第 3 步:启动(设置)Azure 节点

若要在 Azure 中预配角色实例,必须启动添加到 HPC 群集的 Azure 节点。 然后,将节点联机,以便它们可用于运行群集作业。

节点的启动方式和联机方式取决于在 Azure 节点模板中配置的可用性策略,如下所示:

  • 自动 节点在每周的一个或多个间隔内自动配置为处于 “联机” 状态。 无需执行其他操作。

  • 手动 必须先启动节点,然后将其联机,使其可用于运行群集作业。

重要

从 HPC Pack 2012 R2 Update 1 开始,手动选择要在 Azure 中启动的一个或多个节点。 指定要启动的节点可以来自多个 Azure 节点部署。 在早期版本的 HPC Pack 中,只能启动使用一个节点模板部署的完整节点集。

手动启动 HPC Pack 2012 R2 Update 1 中引入的特定 Azure 节点 ()

  1. 在某些 HPC Pack) 版本中称为“节点管理”的资源管理 (导航窗格中,单击“节点”。

  2. “列表 ”或“ 热度地图 ”视图中,选择要启动的一个或多个 Azure 节点。

  3. “操作”窗格中,单击“启动”。 此时将显示“ 启动 Azure 节点 ”对话框。

  4. 在启动过程中,节点的状态从 “未部署” 更改为 “正在预配”。 如果要跟踪预配进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

  5. 节点成功启动后,节点状态将更改为“脱机”。

  6. 若要使节点联机,请选择处于 “脱机” 状态的节点,右键单击,然后单击“ 联机”。

手动启动一组 Azure 节点并将其联机 (HPC Pack 2012 R2 及更早版本

  1. 在某些 HPC Pack) 版本中称为“节点管理”的资源管理 (导航窗格中,单击“节点”。

  2. “列表 ”或“ 热度地图 ”视图中,选择一个或多个节点。

  3. “操作”窗格中,单击“启动”。 此时将显示“ 启动 Azure 节点 ”对话框。

  4. 如果选择了使用不同节点模板添加的节点,请选择节点模板以指定要启动的节点集。 然后单击“ 开始”。

  5. 在启动过程中,节点的状态从 “未部署” 更改为 “正在预配”。 如果要跟踪预配进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

  6. 节点成功启动后,节点状态将更改为“脱机”。

  7. 若要使节点联机,请选择处于 “脱机” 状态的节点,右键单击,然后单击“ 联机”。

    注意

    从 HPC Pack 2008 R2 SP3 开始,可以将某些节点联机,并在节点从 预配 节点状态移动到 脱机 节点状态后立即在节点上运行作业,即使你开始预配的节点组中的其他节点仍处于 预配 状态。 在这种情况下,整个节点组的运行状况仍显示为 “过渡”。 无需等待节点的运行状况转换为“正常”。

其他注意事项

  • 若要手动启动使用单节点模板添加的 Azure 节点集,还可以使用 Start-HpcNodeSet HPC PowerShell cmdlet。

  • 从 HPC Pack 2012 R2 Update 1 开始,若要手动启动一个或多个指定的 Azure 节点,也可以使用 Start-HpcAzureNode HPC PowerShell cmdlet。

  • 启动 Azure 节点可能需要一些时间才能完成,具体取决于节点数和 Azure 的性能。 在此期间,预配日志不经常更新。 当节点运行状况为“ 过渡”时,可以取消节点的预配。 如果在预配一个或多个节点期间出错,这些节点的状态将设置为 “未知 ”,节点运行状况设置为“ 未批准”。 若要确定失败的原因,请查看预配日志。 可以在门户中找到有关角色实例状态的其他信息。 还可以查看在角色实例上生成的跟踪日志文件。 有关详细信息,请参阅 使用 Microsoft HPC Pack 排查 Azure 节点的部署问题

  • 如果配置了自动可用性策略,则只有在 Azure 中预配了角色实例之后,节点才可用于在联机时间块中运行作业。 (节点) 联机的计划时间不包括 Azure 预配角色实例所需的时间。

  • Azure 订阅将按节点可用时间以及所使用的计算和存储服务收费。 有关详细信息,请查看 Azure 订阅的条款。

  • 每次启动一组 Azure 节点时,Azure 中的 HPC Pack 会自动配置其他代理角色实例,以促进头节点与节点之间的通信。 代理角色实例的数量和大小取决于 HPC Pack 的版本。 预配节点后,代理角色实例不会在 HPC 群集管理器中列出。 但是,实例会显示在门户中。 代理角色实例与 Azure 节点实例一起在 Azure 中产生费用。 有关详细信息,请参阅 设置 Azure 代理节点数

步骤 4:停止 Azure 节点

如果在 Azure 节点的节点模板中配置了自动可用性策略,则节点会自动脱机,并在策略中每个联机时间块结束时停止。 停止节点会关闭并从 Azure 云服务中删除实例,并将节点返回到群集中的 “未部署” 状态。

如果为节点配置了手动可用性策略,可以随时手动停止辅助角色实例。 你可能希望这样做,以确保不会为未使用的 Azure 资源付费。

重要

从 HPC Pack 2012 R2 开始,可以手动停止 Azure 中的特定节点,以便在不再需要时纵向缩减 Azure 节点。 指定要停止的节点可以来自多个 Azure 节点部署。 在早期版本的 HPC Pack 中,只能停止使用一个节点模板部署的完整节点集。

若要手动停止 HPC Pack 2012 R2 中引入的特定 Azure 节点 ()

  1. 在某些 HPC Pack) 版本中称为“节点管理”的资源管理 (导航窗格中,单击“节点”。

  2. “列表 ”或“ 热度地图 ”视图中,选择要停止的一个或多个 Azure 节点。

  3. “操作 ”窗格中,单击“ 停止”。 此时将显示“ 停止 Azure 节点 ”对话框。

  4. 如果要取消节点上运行的作业以立即停止节点,请选择该选项。 否则,节点将在排出任何正在运行的作业后正常停止。 然后单击“ 停止”。

  5. 如果要跟踪停止进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

(HPC Pack 2012 及更早版本手动停止一组 Azure 节点)

  1. 在某些 HPC Pack) 版本中称为“节点管理”的资源管理 (导航窗格中,单击“节点”。

  2. “列表” 或“ 热度地图 ”视图中,选择一个或多个 Azure 节点。

  3. “操作 ”窗格中,单击“ 停止”。 此时将显示“ 停止 Azure 节点 ”对话框。

  4. 如果选择了使用不同节点模板添加的节点,请选择节点模板以指定要停止的节点集。

  5. 如果要取消节点上运行的作业以立即停止节点,请选择该选项。 否则,节点将在排出任何正在运行的作业后正常停止。 然后单击“ 停止”。

  6. 如果要跟踪停止进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

其他注意事项

  • 若要使用单个 Azure 节点模板) 手动停止 (部署的一组 Azure 节点,还可以使用 Stop-HpcNodeSet HPC PowerShell cmdlet

  • 如果要手动停止一组 Azure 节点并将其从群集中删除,可以使用 Remove 操作或 Remove-HpcNodeSet HPC PowerShell cmdlet。

  • 在 Azure 中停止或删除一组节点可能需要几分钟才能完成。 在此过程中,云服务中的代理节点也会被删除。

  • 从 HPC Pack 2012 R2 开始,若要手动停止或删除指定的 Azure 节点,还可以使用 Stop-HpcAzureNodeRemove-HpcAzureNode HPC PowerShell cmdlet。

  • 只应使用 HPC 群集管理器停止或删除 Azure 节点。 请勿使用门户或其他 Azure 工具删除角色实例。

另请参阅

使用 Microsoft HPC Pack 迸发到 Azure 辅助角色实例
为 Microsoft HPC Pack 配置 Azure Node 模板