取代 Azure Stack Hub 縮放單位節點上的硬體元件
本文說明更換非熱插拔硬體元件的一般程序。 實際取代步驟會因原始設備製造商 (OEM) 硬體廠商而異。 如需您 Azure Stack Hub 整合式系統專屬的詳細步驟,請參閱廠商的現場可更換單元 (FRU) 文件。
警告
韌體調整是成功執行本文所述作業的要件。 缺少此步驟可能會導致系統不穩定、效能降低、安全性威脅,或造成 Azure Stack Hub 自動化無法部署作業系統。 更換硬體時請務必參閱硬體合作夥伴的文件,以確保套用的韌體符合 Azure Stack Hub 管理員入口網站中顯示的 OEM 版本。
警告
Azure Stack Hub 要求解決方案中所有伺服器的設定都具有相同的設定,例如,包括 CPU (型號、核心)、記憶體數量、NIC 和連結速度,以及儲存裝置。 Azure Stack Hub 不支援硬體取代期間或新增縮放單位節點時的 CPU 型號變更。 CPU 的變更 (例如升級) 將需要每個縮放單位節點的統一 CPU,以及 Azure Stack Hub 的重新部署。
非熱插拔元件包含下列項目:
- CPU (必須屬於相同類型 (型號、核心)*
- 記憶體*
- 主機板/基礎板管理控制器 (BMC)/視訊卡
- 磁碟控制卡/主機匯流排介面卡 (HBA)/背板
- 網路介面卡 (NIC)
- 圖形處理器 (GPU)
- 作業系統磁碟*
- 資料磁碟機 (不支援熱插拔的磁碟機,例如 PCI-e 附加介面卡)*
*這些元件可能支援熱插拔,但可能會隨著廠商實作方式而不同。 如需詳細步驟,請參閱 OEM 廠商的 FRU 文件。
下列流程圖顯示更換非熱插拔硬體元件的一般 FRU 程序。
- 根據硬體的實體條件,可能不需要此動作。
** 不論 OEM 硬體廠商是否會更換和更新元件,韌體都可能因為支援合約而有所不同。
檢閱警示資訊
Azure Stack Hub 健康狀態和監視系統會針對儲存空間直接存取所控制的網路介面卡和資料磁碟機追蹤其健康情況。 但不會追蹤其他硬體元件。 針對所有其他硬體元件,在硬體生命週期主機上執行之廠商特定硬體監視解決方案中引發警示。
元件更換程序
下列步驟提供元件取代流程的高階概觀。 請務必參考您 OEM 提供的 FRU 文件,再遵循這些步驟。
使用「關機」動作來正常關閉縮放單位節點。 根據硬體的實體條件,可能不需要此動作。
在關機動作確實失敗的罕見情況下,使用清空動作,讓縮放單位節點進入維護模式。 根據硬體的實體條件,可能不需要此動作。
注意
在任何情況下,同一時間都只能將一個節點停用並關閉電源,才不會中斷 S2D (儲存空間直接存取)。
縮放單位節點處於維護模式之後,請使用關閉電源動作。 根據硬體的實體條件,可能不需要此動作。
注意
在關閉電源動作無法運作的罕見情況下,請改用基礎板管理控制器 (BMC) Web 介面。
更換損毀的硬體元件。 不論 OEM 硬體廠商是否會更換元件,都可能會因為支援合約而有所不同。
更新韌體。 請遵循使用硬體生命週期主機的廠商特定韌體更新程序,確定已取代的硬體元件已套用核准的韌體層級。 不論 OEM 硬體廠商是否執行這個步驟,都可能會因為支援合約而有所不同。
使用修復動作,將縮放單位節點回復到縮放單位。
使用具有特殊權限的端點來檢查虛擬磁碟修復狀態。 利用新的資料磁碟機,根據系統負載與已耗用的空間而定,完整的儲存體修復作業可能需要數小時的時間。
當修復動作完成之後,驗證已自動關閉所有作用中警示。