Microsoft HPC Pack

Microsoft HPC Pack 是一個以 Windows Server 技術建置在 Microsoft Azure 上的免費 HPC 解決方案,並支援各種不同的 HPC 工作負載。此頁面說明 HPC Pack 與 Cyclecloud 整合的功能和設定詳細資料。

限制和支援的版本

CycleCloud 支援 Update 3) 和Microsoft HPC Pack 2019的 Microsoft HPC Pack 2016 (,但下列限制如下:

  • 叢集必須在Active Directory 網域中建立。
  • 叢集只能包含單一前端節點。
  • 尚未支援前端節點上的高可用性。
  • 不支援前端節點 VM 映射自訂。
  • 尚未支援 Linux 計算節點。
  • 前端節點需要輸出網際網路存取權,才能下載 Nuget 二進位檔和 Python3。
  • 尚未支援 CLI 和 cloud-init 設定。

先決條件

Active Directory 網域

目前所有 HPC Pack 節點都必須加入Active Directory 網域。 如果您要在虛擬網路中部署 HPC Pack 叢集,此虛擬網路具有站對站 VPN 或 ExpressRoute 連線與您的公司網路,通常已經有現有的Active Directory 網域。 如果您還沒有虛擬網路中的 AD 網域,您可以選擇將前端節點升階為網域控制站來建立新的 AD 網域。

Azure 金鑰保存庫

Microsoft HPC Pack 需要 PFX 憑證來保護節點通訊,而且也需要 AD 網域使用者認證,才能將節點加入 AD 網域。 雖然您可以直接在範本中指定 PFX 檔案、保護密碼和使用者密碼,但我們強烈建議使用 Azure 金鑰保存庫來保護憑證和使用者密碼的處理。 請參閱建立 Azure 金鑰保存庫 憑證

叢集也需要 AD 系統管理員帳戶的使用者名稱和密碼,才能在建立節點時加入網域。 強烈建議使用 Azure 金鑰保存庫。

Azure 使用者指派的受控識別

若要針對憑證和認證使用 Azure 金鑰保存庫,您必須建立 Azure 使用者指派的受控識別,並授與 Azure 金鑰保存庫的秘密和憑證的Get許可權。

您可以參閱此金鑰保存庫教學課程,以建立具有金鑰保存庫存取權的金鑰保存庫和受控識別。

建議您使用Azure Role-Based 存取控制,將金鑰保存庫許可權指派給受控識別。

HPC Pack 節點角色

HPC Pack 叢集中有三個不同的節點角色:

  • 前端節點:提供叢集管理和作業排程服務。 目前僅支援具有本機資料庫的單一前端節點。
  • 訊息代理程式節點:接收來自 SOA 用戶端的要求、將它們散發至計算節點上的服務主機,然後收集回應,並將其傳回用戶端。 訊息代理程式節點將會在 訊息代理 程式節點陣列中建立。 如果您想要在叢集中執行 SOA 工作負載,您必須建立訊息代理程式節點。
  • 計算節點:接受和執行叢集作業。 計算節點將會在 cn 節點陣列中建立。

建立新的 HPC Pack 叢集

您可以按一下[排程器] 底下的[Microsoft HPC Pack] 圖示,以建立新的 Microsoft HPC Pack 叢集。

在 [ 關於 ] 頁面上,指定叢集的唯一 叢集名稱 ,因為它將用來作為前端節點的 NetBIOS 電腦名稱稱,請確定它在 AD 網域中是唯一的,並符合 命名慣例

基本設定

  • HPC Pack 版本:您可以使用 Update 3) 選取 HPC Pack 2019HPC Pack 2016 (。 建議您使用最新的 HPC Pack 版本,也就是 HPC Pack 2019。
  • 虛擬機器:您可以選取您要在其中建立 HPC Pack 叢集的 Azure區域,以及每個叢集節點角色的VM 類型。 您也可以指定 Num。如果您想要在叢集中執行 SOA 工作負載, Brokers 可建立一或多個 Broker 節點。

自動調整

叢集會在沒有任何計算節點的情況下啟動。 您可以啟用 自動調整 ,根據叢集工作負載自動相應增加/減少計算節點,您可以使用 Max Cores 來指定叢集的計算 vCPU 核心數目上限。 自動調整程式會在前端節點上以 Windows 排程工作的形式每分鐘執行一次。

計算節點有兩個相應減少選項: 解除配置終止。 如果您選擇 [終止 ] 選項,HPC Pack 叢集一律會在相應減少時移除計算節點 VM。 如果您選擇 [解除配置 ] 選項,HPC Pack 叢集將會在相應減少時解除配置計算節點 VM,並在 VM 保留天數) 最多維護最多可設定的天數 (。只要仍保留已解除配置的計算節點,就不會從 HPC Pack 叢集中移除。不過,它們將會離線,並在 HPC Pack 叢集中顯示為無法連線。 HPC Pack 叢集建議使用 [解除配置 ] 選項,因為它可以大幅減少相應增加的節點準備時間,而且您只需要支付已解除配置 VM 的磁片儲存體費用。

基礎結構設定

  • 虛擬網路:您可以選取將在其中建立 HPC Pack 叢集的現有虛擬網路和子網。
  • Active Directory 網域:如果您的虛擬網路中已經有 AD 網域,請指定完整的功能變數名稱和叢集節點將加入其中的OU 路徑。 或者,選取 [新增 AD 網域 ],將前端節點升階為網域控制站,以建立新的 AD 網域。
  • 秘密和憑證:強烈建議您選取[使用 KeyVault] 來使用Azure 金鑰保存庫來傳遞節點通訊憑證和使用者密碼。 在MSI 身分識別中,從下拉式清單中選取您在 [必要條件] 中建立的 [Azure 使用者指派的身分識別],然後指定在必要條件中建立的 Azure Key Vault 名稱
  • 使用者認證:在 [使用者名稱 ]中,指定功能變數名稱。 在[密碼密碼]中,指定您在必要條件中建立的 Azure 金鑰保存庫秘密名稱,以儲存網域使用者密碼。
  • PFX 憑證:在[憑證名稱] 中,指定您在必要條件中建立的 Azure 金鑰保存庫憑證名稱。

進階設定

  • Azure 設定:從下拉式清單中選取 Azure 雲端 認證
  • 叢集軟體:為每個叢集節點角色指定作業系統 (作業系統) 。
  • 進階網路:根據預設,虛擬網路中設定的 DNS 伺服器會套用至所有 HPC 節點,如果您想要使用不同的 DNS 伺服器,您可以選擇性地指定 DNS 伺服器 。 您也可以選擇性地選取 [HN 公用 IP ] 來指派前端節點的公用 IP 位址。

azhpcpack CLI

azhpcpack.ps1 CLI 是排程工作呼叫 azhpcpack.ps1 autoscale (所有自動調整行為的主要介面) 。 CLI 適用于 C:\cycle\hpcpack-autoscaler\bin)

CLI 可用來診斷自動調整的問題,或從前端節點內手動控制叢集調整。

命令 描述
自動調整 端對端自動調整程式,包括建立、刪除和聯結節點。
貯體 列印自動調整貯體資訊,例如限制等
config 將任何前置處理之後的有效自動調整設定寫入 stdout
create_nodes 建立一組給定各種條件約束的節點。 nodemanager 介面的 CLI 版本。
default_output_columns 輸出選擇性命令的預設輸出資料行。
delete_nodes 刪除節點並從叢集收回。
initconfig 建立初始自動調整設定。寫入 stdout。
限制 為每個貯體寫入一組詳細的限制。 預設為 json,因為欄位數目。
nodes 查詢節點。
refresh_autocomplete 重新整理叢集特定資源和節點的本機自動完成資訊。
retry_failed_nodes 重試處於失敗狀態的所有節點。
validate_constraint 然後驗證輸出為 JSON 一或多個條件約束。