管理 Azure Stack Hub 的儲存體基礎結構
本文說明 Azure Stack Hub 儲存體基礎結構資源的健全狀態和操作狀態。 這些資源包括儲存體磁碟機和磁碟區。 本主題中的資訊可協助您針對各種問題 (例如磁碟機無法新增至集區) 進行疑難排解。
磁碟區狀態
若要了解磁碟區所處的狀態,請使用下列 PowerShell 命令:
$scaleunit_name = (Get-AzsScaleUnit)[0].name
$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name
Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB
下列輸出範例顯示已中斷連結的磁碟區和已降級/不完整的磁碟區:
VolumeLabel | HealthStatus | OperationalStatus |
---|---|---|
ObjStore_1 | Unknown | 已卸離 |
ObjStore_2 | 警告 | {已降級、不完整} |
以下各節列出健全狀態和操作狀態:
磁碟區健全狀態:Healthy
操作狀態 | 描述 |
---|---|
[確定] | 磁碟區狀況良好。 |
次佳 | 資料未平均寫入各個磁碟機。 動作: 請連絡支援人員,以最佳化存放集區中的磁碟機使用情形。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 在還原失敗的連線之後,您可能必須從備份還原。 |
磁碟區健全狀態:警告
磁碟區的健全狀態為「警告」時,表示您的資料有一或多個複本無法使用,但 Azure Stack Hub 仍可讀取至少一個資料複本。
操作狀態 | 描述 |
---|---|
運作中 | Azure Stack Hub 正在修復磁碟區,例如,新增或移除磁碟機之後的修復。 修復完成後,磁碟區應該就會恢復為「正常」健全狀態。 動作: 等到 Azure Stack Hub 完成磁碟區修復後,再查看其後的狀態。 |
不完整 | 磁碟區的復原能力因一或多個磁碟機故障或遺失而下降。 不過,遺失的磁碟機包含您的資料最新的複本。 動作: 重新連接任何遺失的磁碟機,並更換任何故障的磁碟機,然後使任何離線的伺服器重新上線。 |
已降級 | 磁碟區的復原能力因為一或多個磁碟機故障或遺失而下降,且這些磁碟機上有已過期的資料複本。 動作: 重新連接任何遺失的磁碟機,並更換任何故障的磁碟機,然後使任何離線的伺服器重新上線。 |
磁碟區健全狀態:狀況不良
磁碟區處於「狀況不良」的健全狀態時,當下將無法存取磁碟區上的部分或所有資料。
操作狀態 | 描述 |
---|---|
無備援 | 有太多磁碟機故障,因此磁碟區已遺失資料。 動作: 請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 |
磁碟區健全狀態:Unknown
如果虛擬磁碟已中斷連結,磁碟區也可能處於「不明」健全狀態。
操作狀態 | 描述 |
---|---|
已卸離 | 儲存裝置發生可能導致磁碟區無法存取的故障。 部分資料可能會遺失。 動作: 1.檢查所有儲存裝置的實體和網路連線。 2.如果所有裝置皆正確連線,請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 在還原失敗的連線之後,您可能必須從備份還原。 |
磁碟機狀態
請使用下列 PowerShell 命令監視磁碟機的狀態:
$scaleunit_name = (Get-AzsScaleUnit)[0].name
$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name
Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB
以下各節說明磁碟機可能的健全狀態:
磁碟機健全狀態:Healthy
操作狀態 | 描述 |
---|---|
[確定] | 磁碟區狀況良好。 |
運作中 | 磁碟機正在執行某些內部內務處理作業。 此動作完成後,磁碟機應該就會恢復為「正常」健全狀態。 |
磁碟機健全狀態:警告
處於「警告」狀態的磁碟機可成功讀取和寫入資料,但會發生問題。
操作狀態 | 描述 |
---|---|
中斷通訊 | 磁碟機的連線已中斷。 動作: 將所有伺服器恢復上線。 若仍無法解決問題,請重新連接磁碟機。 若此狀態持續發生,請更換磁碟機以確保完整的復原能力。 |
預期性故障 | 預期磁碟機即將發生故障。 動作: 盡快更換磁碟機以確保完整的復原能力。 |
IO 錯誤 | 存取磁碟機時會發生暫時性錯誤。 動作: 若此狀態持續發生,請更換磁碟機以確保完整的復原能力。 |
暫時性錯誤 | 磁碟機發生暫時性錯誤。 這錯誤通常表示磁碟機沒有回應,但也可能表示儲存空間直接存取的保護分割區已從磁碟機中不當移除。 動作: 若此狀態持續發生,請更換磁碟機以確保完整的復原能力。 |
異常延遲 | 磁碟機有時沒有回應,並出現故障的跡象。 動作: 若此狀態持續發生,請更換磁碟機以確保完整的復原能力。 |
正在從集區移除 | Azure Stack Hub 正在從存放集區移除磁碟機。 動作: 等到 Azure Stack Hub 完成磁碟機移除後,再查看其後的狀態。 若狀態不變,請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 |
正在進入維護模式 | Azure Stack Hub 正在使磁碟機進入維護模式。 這是暫時性的狀態:磁碟機應該很快就會處於維護模式狀態。 動作: 等到 Azure Stack Hub 完成此程序後,再查看其後的狀態。 |
處於維護模式 | 磁碟機處於維護模式,暫停磁碟機的讀取和寫入作業。 此狀態通常表示 Azure Stack Hub 正在對磁碟機執行系統管理工作,例如 PNU 或 FRU。 但是,系統管理員也可能將磁碟機置於維護模式。 動作: 等到 Azure Stack Hub 完成系統管理工作後,再查看其後的狀態。 若狀態不變,請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 |
正在停止維護模式 | Azure Stack Hub 正在將磁碟機恢復上線。 這是暫時性的狀態 - 磁碟機應該很快就會處於另一個狀態,符合預期的「良好」。 動作: 等到 Azure Stack Hub 完成此程序後,再查看其後的狀態。 |
磁碟機健全狀態:狀況不良
處於「狀況不良」狀態的磁碟機目前無法進行寫入或存取。
操作狀態 | 描述 |
---|---|
Split | 磁碟機已與集區分離。 動作: 更換具有新磁碟的磁碟機。 如果您必須使用此磁碟,請從系統中移除磁碟,並確定磁碟上沒有任何有用的資料,再清除磁碟,然後重新安裝磁碟。 |
無法使用 | 實體磁碟已遭隔離,因為您的解決方案廠商並不支援。 只有通過解決方案核准、且具有正確磁碟韌體的磁碟,才受到支援。 動作: 更換磁碟機,且其磁碟的製造商和型號必須已通過解決方案核准。 |
過時的中繼資料 | 替換磁碟先前已使用過,且可能包含來自不明儲存體系統的資料。 此磁碟已遭隔離。 動作: 更換具有新磁碟的磁碟機。 如果您必須使用此磁碟,請從系統中移除磁碟,並確定磁碟上沒有任何有用的資料,再清除磁碟,然後重新安裝磁碟。 |
無法辨識的中繼資料 | 若在磁碟機上發現無法辨識的中繼資料,通常表示該磁碟機上有來自不同集區的中繼資料。 動作: 更換具有新磁碟的磁碟機。 如果您必須使用此磁碟,請從系統中移除磁碟,並確定磁碟上沒有任何有用的資料,再清除磁碟,然後重新安裝磁碟。 |
故障的媒體 | 磁碟機故障,且儲存空間不會再加以使用。 動作: 盡快更換磁碟機以確保完整的復原能力。 |
裝置硬體故障 | 此磁碟機發生硬體故障。 動作: 盡快更換磁碟機以確保完整的復原能力。 |
正在更新韌體 | Azure Stack Hub 正在更新磁碟機上的韌體。 這是暫時性的狀態,持續時間通常少於一分鐘,且在此期間,集區中的其他磁碟機將會處理所有的讀取和寫入。 動作: 等到 Azure Stack Hub 完成更新後,再查看其後的狀態。 |
啟動中 | 磁碟機正在進行作業準備。 這應該是暫時性的狀態:完成後,磁碟機應該就會轉換成不同的作業狀態。 動作: 等到 Azure Stack Hub 完成作業後,再查看其後的狀態。 |
磁碟機無法進入集區的原因
有些磁碟機純粹就是因為尚未就緒,而無法放入 Azure Stack Hub 存放集區中。 您可以查看磁碟機的 CannotPoolReason
屬性,以了解磁碟機無法放入集區中的原因。 下表將對各種原因的說明稍作補充。
原因 | 描述 |
---|---|
硬體不符合規範 | 磁碟機未列於使用健康情況服務指定的合格儲存體模型清單中。 動作: 更換具有新磁碟的磁碟機。 |
韌體不符合規範 | 實體磁碟機上的韌體未列於使用健康情況服務指定的合格韌體修訂版本清單中。 動作: 更換具有新磁碟的磁碟機。 |
由叢集使用中 | 磁碟機目前由容錯移轉叢集使用中。 動作: 更換具有新磁碟的磁碟機。 |
卸除式媒體 | 磁碟機歸類為卸除式磁碟機。 動作: 更換具有新磁碟的磁碟機。 |
狀況不良 | 磁碟機未處於良好狀態,可能需要更換。 動作: 更換具有新磁碟的磁碟機。 |
容量不足 | 有分割區佔用磁碟機上的可用空間。 動作: 更換具有新磁碟的磁碟機。 如果您必須使用此磁碟,請從系統中移除磁碟,並確定磁碟上沒有任何有用的資料,再清除磁碟,然後重新安裝磁碟。 |
驗證進行中 | 健康情況服務正在檢查磁碟機或磁碟機上的韌體,確認是否已通過使用核准。 動作: 等到 Azure Stack Hub 完成此程序後,再查看其後的狀態。 |
驗證失敗 | 健康情況服務無法檢查磁碟機或磁碟機上的韌體以確認是否已通過使用核准。 動作: 請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 |
離線 | 磁碟機已離線。 動作: 請連絡支援人員。 在此之前,請先參考 https://aka.ms/azurestacklogfiles 的指引開始進行記錄檔收集程序。 |