使用計量警示來警示您在 Azure 環境中的效能問題

已完成

Azure 監視器可以使用閾值來監視特定資源。 在組織中,相較於每次儲存檔案時收到警示,當伺服器上的可用磁碟空間低於百分之五時收到通知更為實用。

身為解決方案架構師,您想要針對許多目標資源和執行個體,實作定期閾值監視。 監視有助於在潛在問題影響您的客戶之前,先加以阻止。

在本單元中,您會調查 Azure 監視器支援的不同計量警示類型。

何時會使用計量警示?

在 Azure 監視器中,您可以使用計量警示來達到 Azure 資源的定期閾值監視。 Azure 監視器會定期執行計量警示觸發條件。 評估為 true 時,Azure 監視器就會傳送通知。 計量警示具狀態,且 Azure 監視器只會在符合先決條件時傳送通知。

例如,如果您需要知道伺服器 CPU 使用率何時達到 90% 的重大閾值,計量警示可能很有用。 您可以在資料庫儲存體變得太低,或網路延遲即將達到無法接受的等級時收到警示。

計量警示的組成

正如您在上一單元中了解到的,所有警示都是管理它們的規則的產物。 針對計量警示,還有額外因素需要定義:條件類型。 其可以是靜態或動態。

您必須定義要搭配靜態或動態計量警示使用的統計分析類型。 範例類型包括最小值、最大值、平均值與總計。 在此範例中,您將定義要評估的資料期間:過去 10 分鐘。 最後,您可設定檢查警示條件的頻率:每兩分鐘。

使用靜態閾值計量警示

靜態計量警示是以您定義的簡單靜態條件和臨界值為基礎。 您可以使用靜態計量來指定用於觸發警示或通知的閾值。

在先前定義的案例中,閾值為 85% CPU 使用率的靜態警示會每兩分鐘檢查一次規則。 其會評估過去 10 分鐘的 CPU 使用率資料,以評估其是否超過閾值。 如果評估為 true,則警示會觸發與動作群組相關聯的動作。

使用動態閾值計量警示

動態計量警示會使用 Azure 提供的機器學習工具,自動改善初始規則所定義的閾值準確度。

動態計量中沒有硬性閾值。 不過,您需要再定義兩個參數:

  • 「回溯查看期間」會定義需要評估前幾期。 例如,如果您將回溯查看期間設定為三,則在這裡使用的範例中,評估的資料範圍會是 30 分鐘 (三組 10 分鐘)。

  • 違規次數表示邏輯條件必須偏離預期行為多少次,警示規則才會引發通知。 在此範例中,如果您將違規次數設定為二,則警示會在兩次偏離計算閾值的情況下觸發。

了解維度

到目前為止,我們討論的評估計量警示主要針對單一目標執行個體。 Azure 監視器支援維度,其可讓您從多個目標執行個體提供監視資料。

您可以使用維度來定義一個計量警示規則,並將其套用到多個相關的執行個體。 例如,您可以監視執行您應用程式之所有伺服器的 CPU 使用率。 您接著可以在觸發規則條件時接收每個伺服器執行個體的個別通知。

您可以透過具體地為每個目標執行個體命名,或使用星號 (*) 萬用字元來定義維度,這會使用所有可用的執行個體。

調整計量警示

就像維度一樣,Azure 監視器也支援建立可監視多個資源的計量警示。 調整目前僅限於 Azure 虛擬機器。 不過,單一計量警示可以監視一個 Azure 區域中的資源。

建立可監視多個資源的調整計量警示規則與建立任何其他計量警示規則並無不同;您只要選取想要監視的所有資源即可。

就像維度一樣,調整計量警示是觸發該警示之資源的個體。