步骤 3:配置群集

已在 HPC 群集) 部署头节点 (或头节点,必须按照 HPC 群集管理器中的 部署任务列表 配置群集。 本部分提供完成所需部署任务的过程,以及添加本地节点所需的多个可选任务。 有关其他部署任务的信息,请参阅本指南的后续部分和 配置:HPC 群集管理器中的主题。

至少必须完成所需的部署任务。 根据向群集添加节点的方式以及将要运行的作业类型,可能需要完成一个或多个可选部署任务。

3.1:配置 HPC 群集网络

HPC 群集网络配置是头节点配置过程中的第一步。 HPC 群集网络是通过按照 HPC 群集管理器中的网络配置向导配置的。 配置 HPC 群集网络时,请选择为群集规划的网络拓扑,如本指南前面的 步骤 1:准备部署中所述。

重要

在开始在 HPC 群集管理器中配置 HPC 群集网络之前,请确保头节点和将作为节点添加到群集的计算机已根据为群集选择的网络拓扑进行物理连接。 此外,请确保能够识别头节点中的每个网络适配器连接到哪个网络。

配置 HPC 群集网络

  1. 如果 HPC 群集管理器尚未在头节点上打开,请将其打开。

  2. “部署任务列表”中,单击“ 配置网络”。 此时将显示“网络配置向导”。

  3. 在“ 网络拓扑选择 ”页上,单击为群集选择的拓扑,然后单击“ 下一步”。

  4. “企业网络适配器选择 ”页上的 “网络适配器 ”列表中,单击物理连接到企业网络的网络适配器的名称,然后单击“ 下一步”。

    重要

    若要确保选择正确的网络适配器,请在从列表中选择网络适配器后,使用此向导页上显示的信息。 使用每个适配器的 IP 地址、域信息和媒体访问控制 (MAC) 地址作为参考。

  5. 如果为群集选择了拓扑编号 5,请跳到此过程中的步骤 9。 否则,请对专用网络适配器重复步骤 4。

  6. 在“ 专用网络配置” 页上,为头节点键入静态 IP 地址和子网掩码。 (可选)为该网络选择网络服务:

    a. 若要向连接到此网络的节点授予对企业网络上资源的访问权限,请在头节点上选择“启用网络地址转换 (NAT) ”框检查。

    b. 若要为连接到此网络的节点启用 DHCP 服务,请选择“启用 DHCP 并定义范围检查”框,然后键入 DHCP 范围的起始和结束 IP 地址。 如果尚未自动检测到网关和 DNS 服务器 IP 地址,请键入其中每个地址。

    有关在群集网络上启用 NAT 和 DHCP 的详细信息,请参阅 附录 1:HPC 群集网络中的“HPC 网络服务”。

  7. 完成专用网络配置后,单击“ 下一步 ”。

  8. 对应用程序网络适配器重复步骤 4、6 和 7。 完成应用程序网络配置后,单击“ 下一步 ”。

  9. 在“ 防火墙设置” 页上,选择群集的防火墙设置:

    a. 若要自动将防火墙设置应用于每个网络上的节点,请单击该网络的“ 打开 ”。

    b. 若要在网络上禁用防火墙,请单击“ 关闭”。

    c. 如果不想更改任何防火墙设置,请单击“ 不管理防火墙设置”。

    有关群集防火墙设置的详细信息,请参阅 附录 1:HPC 群集网络中的“HPC 网络服务”。

  10. “审阅 ”页上,验证设置并单击“ 配置”。 如果要更改任何设置,请在导航窗格中单击相应的向导页或单击“ 上一步”,导航到相应的向导页。

  11. 网络配置过程完成后,在 “配置摘要 ”页上查看配置项目列表。 如果要保存网络配置的报告,请单击“ 保存配置报告”。

  12. 若要关闭向导,请单击“ 完成”。

3.2:提供安装凭据

备注

HPC Pack 2016 不支持 iSCSI 节点部署。

必须提供安装凭据才能将新的本地节点添加到群集。 安装操作系统、安装应用程序以及将节点添加到 Active Directory 域时,将使用这些凭据。

提供安装凭据

  1. 在“待执行部署任务列表”中,单击“提供安装帐号”。 “安装凭据”对话框随即打开。

  2. 键入用户名,包括域 (域\用户) ,然后键入将用于部署节点的域用户帐户的密码。 请注意此帐户的以下注意事项:

    • 该帐户必须是具有足够权限的域帐户,才能为节点创建 Active Directory 计算机帐户,并将节点加入域。 如果组织的策略限制你使用可将新计算机添加到域的域帐户,则需要要求域管理员在部署节点之前在 Active Directory 域服务 中预先创建计算机对象。
    • 如果部署的一部分需要访问企业网络上的资源,则帐户应具有访问这些资源所需的权限。
    • 如果要使用 HPC 群集管理器远程重启节点,该帐户必须是头节点上本地管理员组的成员。 仅当没有可用于远程重启节点的脚本电源控制工具时,才需要此要求。
    • Active Directory 域服务限制经过身份验证的用户可同时加入域的计算机数, (默认值为) 10 台计算机。 如果需要增加此数目来配置新节点, (或域管理员) 可以使用 Adsiedit 工具来编辑域中的 ms-DS-MachineAccountQuota 属性。 有关如何执行此操作的信息,请参阅 Microsoft 知识库中的文章 24337
  3. 若要保存指定的凭据,请单击“ 确定”。

3.3:配置新节点的命名

如果要使用 Azure IaaS 节点模板部署 Azure IaaS 节点,或者从裸机部署节点,并且未使用节点 XML 文件将节点导入群集,则会为部署的新节点自动生成计算机名称。 必须通过定义命名系列来指定这些名称的生成方式。

命名系列通过选择根名称和该名称随附的起始编号来定义。 起始数字括在百分比符号 (%) 中。

例如,如果在指定以下命名系列后部署三个节点:Node-%100%,则会为这些节点分配这些名称:

  • Node-100
  • Node-101
  • Node-102

命名系列的注意事项

  • 节点名称限制为 15 个字符。 指定节点命名系列时,请考虑部署中的节点数,并确保指定的系列不会生成超过 15 个字符的名称。 例如,如果部署将包含 1,000 个节点,并且起始编号为 1,则根名称不能包含超过 12 个字符;否则,节点编号 1,000 将需要包含 16 个字符的名称。
  • 与从裸机部署的计算节点的命名系列不同,无法配置 Azure“突发”节点的命名系列。 Azure 节点在以根名称 AzureCN 开头的命名系列中连续编号。 为了避免潜在的混淆,请勿为根名称 AzureCN 的计算节点配置命名系列。

指定节点命名系列

  1. 在“待执行部署任务列表”中,单击“配置新节点的命名规则”。 此时将打开“指定节点命名系列”对话框。
  2. 键入要使用的命名系列。 “指定节点命名系列”对话框中的预览可帮助你查看如何将命名系列应用于节点名称的示例。
  3. 若要保存指定的节点命名系列,请单击“ 确定”。

3.4:导入或创建用于部署的证书

需要导入或创建证书以从裸机部署节点或手动将节点添加到群集。 在 “部署任务列表”中,单击“ 导入用于部署的证书”。

  • 如果计划跨所有 HPC 节点使用一个证书,或者已在步骤 1.8为其他节点准备证书,请选择“从 PFX 文件导入证书”,并选择“浏览”以选择 PFX 文件并输入保护密码,然后单击“确定”导入证书。

  • 如果还没有 其他节点的证书 ,可以选择“ 创建新的自签名证书 ”以生成新的自签名证书。

证书将放置在安装共享的 “证书” 文件夹中,文件名为 HpcCnCommunication.pfx

3.5: (可选) 创建节点模板

节点模板定义配置节点并将其添加到群集所需的任务。 例如,使用计算节点模板,可以部署操作系统映像、将特定驱动程序和软件添加到节点、将预配置的节点添加到群集,或将软件更新应用于节点。

节点模板类型

HPC Pack 2019 有三个无法修改的内置节点模板:

  • HeadNode 模板 - 所有头节点都自动分配给此模板。
  • LinuxNode 模板 - 所有 Linux 节点都自动分配给此模板。
  • NonDomain ComputeNode 模板 - 所有未加入域的计算节点会自动分配给此模板。

由于可能有多个类型的节点,或者可能以不同的方式将节点添加到群集,因此可以创建适用于不同节点或情况的不同模板。

根据要添加到群集的节点类型,可以创建四种类型的节点模板:

  • 计算节点模板 - 用于将计算节点添加到群集。 HPC Pack 将创建名为 Default ComputeNode Template 的默认计算节点模板。
  • 代理节点模板 - 用于将代理节点添加到群集。
  • 工作站节点和非托管服务器节点模板 - 用于添加工作站节点或非托管服务器节点,并指定是否希望这些节点根据每周可用性策略或手动使这些节点联机和脱机。
  • Azure 节点模板 - 使用已创建或添加到 Azure 订阅的帐户和功能,) 添加 Azure 节点 (辅助角色实例来扩展群集容量。 指定是要根据每周可用性策略将这些节点联机和脱机,还是手动。
  • Azure Batch池模板 - 用于添加Azure Batch池以扩展群集容量。
  • Azure IaaS 节点模板 - 如果群集完全位于 Azure 中,或者是 Azure 与组织网络之间具有站点到站点 VPN 的混合群集,则使用 添加 Azure IaaS 节点以扩展群集容量。

计算节点模板和代理节点模板进一步分为两种类型,具体取决于要将这些类型的节点添加到群集的方式:

  • 对于操作系统映像 (当前不支持) - 此类型的模板包括用于在计算节点或代理节点上部署操作系统的步骤。 从裸机添加节点时,请使用这种类型的模板。
  • 没有操作系统映像 - 此类型的模板用于将预配置的计算节点和中转站节点添加到群集。

创建节点模板

  1. 在“待执行部署任务列表”中,单击“创建节点模板”。 此时会显示“创建节点模板向导”。

  2. “选择节点模板类型 ”页上,选择要创建的节点模板的类型。 此过程中的剩余步骤假定你选择以下选项之一:计算节点模板、代理节点模板、工作站节点或非托管服务器节点模板。 (如果要创建 Azure 节点模板,请参阅 为 Microsoft HPC Pack 配置 Azure Node 模板中的主题。)

  3. “指定模板名称 ”页上,键入模板的描述性名称(可选)和说明,然后单击“ 下一步”。

  4. 如果要创建计算节点模板或代理节点模板,请执行以下操作:

    a. 在 “选择部署类型” 页上,单击“不使用操作系统”,然后单击“ 下一步”。

    b. 在“指定 Windows 汇报”页上,指定是否要在模板中添加步骤以使用 Microsoft 更新或企业Windows Server Update Services (WSUS) 下载和安装更新。 此外,还可以指定要添加到模板的特定更新。 单击“下一步”以继续。 转到此过程的最后一步。

  5. 如果要创建工作站节点或非托管服务器节点模板,请在 “配置可用性策略 ”页上,选择希望工作站节点联机和脱机的方式:

    a. 如果希望工作站节点手动联机和脱机,请选择该选项,然后单击“ 下一步”。 转到此过程的最后一步。

    b. 如果希望工作站节点自动联机和脱机,请选择该选项,然后单击“ 配置可用性策略”。 此时将显示“配置工作站可用性策略”对话框。

    c. 在“配置工作站可用性策略”对话框中的“ 可用性策略 ”选项卡上,单击并拖动鼠标以选择节点处于 联机 状态 (可用于运行群集作业) 和 脱机 (无法) 运行群集作业的天数和小时数。

    d. (可选)指定在工作站节点上不启动新作业时,工作站节点脱机前的分钟数。

    e. (可选)在“ 用户活动检测 ”页上,配置用户活动检测设置,以限制在联机时间块期间联机的工作站节点和非托管服务器节点。

    f. 若要保存设置,请单击“ 确定”,然后单击“ 下一步”。

  6. 在“ 审阅 ”页上,单击“ 创建”。

提示

使用“创建节点模板向导”创建的节点模板包括最常见的部署和配置任务。 可以向创建的节点模板添加更多任务,也可以使用节点模板编辑器修改模板设置。 有关详细信息,请参阅 附录 3:节点模板任务和属性

重要

如果在使用该节点模板部署节点的同时编辑节点模板,则所做的更改将在保存更改后立即实现,从而影响等待使用该模板部署的任何节点。 因此,在打开节点模板进行编辑之前,请确定是否有任何正在部署或等待部署的节点,如果存在,请确保这些节点均未使用要编辑的模板。

3.5: (可选) 添加用户

如果要向组织的其他成员授予群集访问权限,则需要以 HPC 群集用户或 HPC 群集管理员等角色将他们的域用户帐户或域组添加到群集。 例如,若要将作业提交到群集或执行诊断测试,域用户必须至少是 HPC 群集用户。 HPC 群集管理员有权管理群集的所有方面。 有关其他角色的信息,请参阅 管理群集用户

添加用户的注意事项

  • 最佳做法是创建域组来管理不同的群集角色。 然后,将每个域组添加到相应的群集角色。
  • HPC 群集管理员还会添加为头节点计算机上的本地 Administrators 组和 HPCAdminMirror 组的成员。
  • HPC 群集用户也作为头节点计算机上本地 HPCUsers 组的成员添加。

添加群集用户和管理员

  1. “部署任务列表”中的 “可选部署任务”下,单击“ 添加或删除用户”。

  2. 添加 HPC 群集用户:

    a. 在 “操作 ”窗格中,单击“ 添加用户”。 此时将显示“选择用户或组”对话框。

    b. 键入要添加为 HPC 群集用户的域用户或组的名称,然后单击“ 检查名称”。 有关详细信息,请在“选择用户或组”窗口中单击“ 示例”。

    c. 对要添加的所有 HPC 群集用户重复上一步。

    d. 添加完 HPC 群集用户后,单击“ 确定”。

  3. 添加 HPC 群集管理员:

    a. 在 “操作 ”窗格中,单击“ 添加管理员”。 此时将显示“选择用户或组”对话框。

    b. 键入要添加为 HPC 群集管理员的域用户或组的名称,然后单击“ 检查名称”。 有关详细信息,请在“选择用户或组”窗口中单击“ 示例”。

    c. 对要添加的所有 HPC 群集管理员重复上一步。

    d. 添加完 HPC 群集管理员后,单击“ 确定”。

后续步骤