本文說明取代不可熱交換的硬體元件一般程式。 實際取代步驟會因原始設備製造商 (OEM) 硬體廠商而異。 如需您 Azure Stack Hub 整合式系統專屬的詳細步驟,請參閱廠商的現場可更換單元 (FRU) 文件。
謹慎
韌體撫平對於本文所述作業的成功至關重要。 缺少此步驟可能會導致系統不穩定、效能降低、安全性威脅,或防止 Azure Stack Hub 自動化部署作系統。 更換硬體時,請務必參閱硬體合作夥伴的檔,以確保套用的韌體符合 Azure Stack Hub 系統管理員入口網站中顯示的 OEM 版本,。
警告
Azure Stack Hub 要求解決方案中的所有伺服器設定具有相同的設定,包括 CPU(模型、核心)、記憶體數量、NIC 和連結速度,以及記憶體裝置。 Azure Stack Hub 在硬體更換期間或新增縮放單位節點時,不支援 CPU 模型的變更。 CPU 的變更,例如升級,將需要每個縮放單位節點中的統一 CPU,以及重新部署 Azure Stack Hub。
非可熱交換元件包含下列項目:
- CPU (必須是相同類型(模型、核心)*
- 記憶*
- 主機板/基礎板管理控制器 (BMC)/視訊卡
- 硬碟控制器/主機匯流排轉接卡 (HBA)/背板
- 網路介面卡 (NIC)
- 圖像處理單位 (GPU)
- 作業系統磁碟
- 數據驅動器(不支持熱交換的驅動器,例如PCI-e擴充卡)
*這些元件可能支持熱交換,但可能會因廠商實作而有所不同。 如需詳細步驟,請參閱 OEM 廠商的 FRU 檔。
下列流程圖顯示更換非熱插拔硬體元件的一般 FRU 程序。
- 根據硬體的實體條件,可能不需要此動作。
** OEM 硬體廠商是否執行元件更換和更新,韌體可能會根據您的支持合約而有所不同。
檢閱警示資訊
Azure Stack Hub 健康情況和監視系統會追蹤由 Storage Spaces Direct 控制的網路適配器和數據磁碟驅動器的健康情況。 它不會追蹤其他硬體元件。 針對所有其他硬體元件,在硬體生命週期主機上運行的廠商特定硬體監控解決方案中觸發警報。
元件取代程序
下列步驟提供元件取代流程的高階概觀。 在遵循這些步驟之前,請務必參考您原廠提供的 FRU 文件。
使用 [關機] 動作以優雅地關閉擴展單元節點。 根據硬體的實體條件,可能不需要此動作。
在不太可能的情況下,關機動作會失敗,請使用 [清空 ] 動作將縮放單位節點放入維護模式。 根據硬體的實體條件,可能不需要此動作。
備註
在任何情況下,只有一個節點可以被停用和關閉電源,而不會中斷 S2D(儲存空間直接存取)的運作。
調整單位節點處於維護模式之後,請使用 關閉電源 動作。 根據硬體的實體條件,可能不需要此動作。
備註
在電源關閉方式不太可能無法運作的情況下,請改用基板管理控制器(BMC)網頁介面。
取代損毀的硬體元件。 不論 OEM 硬體廠商是否會取代元件,都可能會因為支援合約而有所不同。
更新韌體。 請遵循使用硬體生命週期主機的廠商特定韌體更新程序,確定已取代的硬體元件已套用核准的韌體層級。 不論 OEM 硬體廠商是否執行這個步驟,都可能會因為支援合約而有所不同。
使用 修復 動作,將縮放單位節點帶回縮放單位。
使用特殊許可權端點來 檢查虛擬磁碟修復狀態。 使用新的數據磁碟驅動器時,完整記憶體修復作業可能需要數小時的時間,視系統負載和耗用的空間而定。
修復動作完成後,請驗證所有作用中的警示都已自動關閉。