健全狀態、計量和閾值

已完成

健康情況模型化的重要部分是量化主要商務需求內容中應用程式的「狀況良好」、「降級」和「狀況不良」狀態。 「交通燈號」模型是代表健全狀態的常見方式。

  • 綠燈狀況良好狀態。 主要非功能性需求已完全滿足,並以最佳方式使用資源。
  • 黃燈降級狀態。 應用程式可運作,但使用者體驗可能受到影響。 系統管理員需要注意以減輕此狀態。
  • 紅燈狀況不良狀態。 應用程式不會如預期般運作或執行。 狀況不良狀態會影響使用者。

在分層健康情況模型中,開始在頂端定義使用者流程的狀態,並向下移至平台資源。 下圖顯示分層健康情況模型範例。 此圖示範基礎元件的健全狀態變更如何對使用者流程和整體應用程式健康情況造成連鎖性衝擊:

Diagram that shows a sample layered health model with cascading heath states.

每一層都應該針對元件使用計量和計量閾值,根據應用程式功能和非功能性需求來代表狀況良好和狀況不良的狀態。 根據元件在生產工作負載中的不同作業特性、穩定狀態和預期行為,定義元件的健全狀態。

例如,計量可能包含例外狀況數目、回應時間和服務計量。 應用程式元件可以相依於 Azure 資源,甚至是其他元件。 您必須考慮這些健全狀態。

以下是計算健康情況分數的一些最佳做法:

  • 彙總參與流程之元件的細微健康情況分數,以表示使用者流程的健全狀態。 其應該包含應用程式元件和所有對應的相依性。 請考慮將主要非功能性需求視為係數。
  • 使用所有對應元件中的最低分數來表示使用者流程的健康情況分數。 根據使用者流程的非功能性需求來考慮相對的實現情況。
  • 確定健康情況分數一致地反映作業健康情況。 如果沒有,請調整並重新部署模型以反映新的資訊。
  • 定義健康情況分數閾值,以反映元件的健全狀態。

效能測試是建立這些狀態的關鍵。 個別元件的細微健康情況分數是關鍵資源層級計量。 下表顯示如何使用資源計量來定義健全狀態的範例:

Diagram of a table that shows health states for a layered health model.

在下一個練習中,我們將量化範例應用程式的健全狀態。 此練習將協助您瞭解標準生產工作負載的預期值。

知識檢查

1.

哪一層位於健康情況模型階層中的最高層級?

2.

當您選取計量和閾值時,您需要:

3.

健康情況模型中的「降級」和「狀況不良」狀態是否有意義?