健全狀態、計量和閾值
健康情況模型化的重要部分是量化主要商務需求內容中應用程式的「狀況良好」、「降級」和「狀況不良」狀態。 「交通燈號」模型是代表健全狀態的常見方式。
- 綠燈:狀況良好狀態。 關鍵非功能需求已完全滿足,且資源會得到最佳利用。
- 黃燈:降級狀態。 應用程式可運作,但使用者體驗可能受到影響。 系統管理員需要注意以減輕此狀態。
- 紅燈:狀況不良狀態。 應用程式不會如預期般運作或執行。 狀況不良的狀態會影響使用者。
在分層健康情況模型中,開始在頂端定義使用者流程的狀態,並向下移至平台資源。 下圖顯示分層健康情況模型範例。 此圖示範基礎元件的健全狀態變更如何對使用者流程和整體應用程式健康情況造成連鎖性衝擊:
每一層都應該使用元件的計量和計量閾值,根據應用程式功能和非功能需求來代表狀況良好且狀況不良的狀態。 根據元件在生產工作負載中的不同作業特性、穩定狀態和預期行為,定義元件的健全狀態。
例如,計量可能包含例外狀況數目、回應時間和服務計量。 應用程式元件可以相依於 Azure 資源,甚至是其他元件。 您必須考慮這些健全狀態。
以下是計算健康情況分數的一些最佳做法:
- 彙總參與流程之元件的細微健康情況分數,以表示使用者流程的健全狀態。 其應該包含應用程式元件和所有對應的相依性。 請考慮將關鍵非功能需求視為係數。
- 使用所有對應元件中的最低分數來表示使用者流程的健康情況分數。 根據使用者流程的非功能需求,將相對成就因素納入考慮。
- 確定健康情況分數一致地反映作業健康情況。 如果沒有,請調整並重新部署模型以反映新的資訊。
- 定義健康情況分數閾值,以反映元件的健全狀態。
效能測試是建立這些狀態的關鍵。 個別元件的細微健康情況分數是關鍵資源層級計量。 下表顯示如何使用資源計量來定義健全狀態的範例:
在下一個練習中,我們會量化範例應用程式的健全狀況狀態。 此練習可協助您瞭解標準生產工作負載的預期值。