什麼是 Azure 監視器警示?

警示可在 Azure 監視器資料指出基礎結構或應用程式可能有問題時主動通知您,協助您在使用者注意到問題之前偵測並解決問題。

您可以在 Azure 監視器資料平台中設置任何計量或記錄資料來源的警示。

下圖顯示警示的運作方式:

說明 Azure 監視器警示的圖形。

警示規則會監視您的遙測資料,並擷取訊號,指出在指定資源上有情況發生。 警示規則會擷取訊號,並檢查訊號是否符合條件的準則。 若符合條件,就會觸發警示,這會起始相關聯的動作群組,並更新警示的狀態。

警示規則結合:

  • 要監視的資源
  • 來自資源的訊號或遙測資料
  • 條件

如果您要監視多個資源,則會對每個資源個別評估條件,並針對每個資源分別引發警示。

觸發警示後,警示會由下列項目組成:

  • 警示處理規則可讓您對引發的警示套用處理。 警示處理規則會在警示引發時,修改所引發的警示。 您可以使用警示處理規則來新增或隱藏動作群組、套用篩選,或依照預先定義的排程處理規則。
  • 動作群組可以觸發通知或自動化工作流程,讓使用者知道已觸發警示。 動作群組可以包括:
    • 電子郵件、SMS 和推播通知等通知方法。
    • Automation Runbooks
    • Azure 函式
    • ITSM 事件
    • Logic Apps
    • 安全 Webhook
    • Webhook
    • 事件中樞
  • 警示條件是由系統所設定。 引發警示時,警示的監視條件會設定為「已引發」,而且當造成警示引發的基礎條件清除時,監視條件會設定為「已解決」。
  • 使用者回應是由使用者所設定,在使用者變更之前不會變更。

您可以在 Azure 入口網站的警示頁面上,查看過去 30 天內產生之所有 Azure 資源中的所有警示執行個體。

警示類型

下表提供每個警示類型的簡短描述。 如需每個警示類型的詳細資訊,以及如何選擇最符合您需求的警示類型,請參閱這篇文章

警示類型 Description
計量警示 \(部分機器翻譯\) 計量警示會定期評估資源計量。 計量可以是平台計量、自訂計量、轉換成計量或 Application Insights 計量的Azure 監視器記錄。 計量警示有數個額外的功能,例如能夠套用多個條件和動態閾值。
記錄警示 \(部分機器翻譯\) 記錄警示可讓使用者使用 Log Analytics 查詢,以預先定義的頻率評估資源記錄。
活動記錄警示 \(部分機器翻譯\) 當發生符合已定義條件的新活動記錄事件時,就會觸發活動記錄警示。 資源健康狀態警示和服務健康情況警示是報表服務和資源健康情況的活動記錄警示。
智慧型偵測警示 Application Insights 資源上的智慧偵測會警告您 Web 應用程式中有潛在的效能問題和失敗異常。 您可以在 Application Insights 資源上移轉智慧偵測,以建立不同智慧偵測模組的警示規則。
Prometheus 警示 (預覽) Prometheus 警示可用來警示 Kubernetes 叢集的效能和健康情況, (包括 AKS) 。 警示規則是以 PromQL 為基礎,這是開放原始碼查詢語言。

現成可用的警示規則 (預覽)

如果您沒有為所選的資源定義警示規則,您可以在 Azure 入口網站中啟用現成可用的警示規則

注意

警示規則建議功能目前為預覽狀態,且僅針對未受監視啟用:

  • 虛擬機器
  • AKS 資源
  • Log Analytics 工作區

用於警示的 Azure 角色型存取控制 (Azure RBAC)

您只能存取、建立或管理您具有權限之資源的警示。

若要建立警示規則,您必須具備:

  • 警示規則目標資源的讀取權限
  • 在建立警示規則的資源群組上的寫入權限 (如果您要從 Azure 入口網站建立警示規則,預設會在目標資源所在的相同資源群組中建立警示規則)
  • 如果適用) ,則任何與警示規則相關聯的動作群組的讀取權限 (

所有 Azure Resource Manager範圍都支援這些內建的 Azure 角色,具有許可權和存取警示資訊,並建立警示規則:

  • 監視參與者:可以在其範圍內建立警示並使用資源
  • 監視讀取器:可以檢視警示和讀取其範圍內的資源

如果目標動作群組或規則位置位於與兩個內建角色不同的範圍內,您需要建立具有適當許可權的使用者。

警示和狀態

您可以將記錄或計量警示設為具狀態或無狀態。 活動記錄警示為無狀態。

  • 每次符合條件時都會引發無狀態警示,即使先前已引發過。
  • 具狀態警示會在條件符合時引發,然後不再引發或觸發任何動作,直到條件得到解決為止。
    針對具狀態警示,警示會在下列情況下視為已解決:
警示類型 警示會在下列情況下視為已解決:
度量警示 連續三次檢查均未符合警示條件。
記錄警示 在記錄警示中,警示會根據警示頻率以不同的速率視為已解決:
  • 1 分鐘:警示條件未符合達 10 分鐘。
  • 5-15 分鐘:警示條件在三個頻率週期後未能符合。
  • 15 分鐘 - 11 小時:警示條件在兩個頻率週期後未能符合。
  • 11 至 12 小時::警示條件在一個頻率週期後未能符合。

當警示視為已解決時,警示規則會使用 Webhook 或電子郵件傳送已解決的通知,並將 Azure 入口網站中的監視狀態設為已解決。

以程式設計方式管理警示

您可以查詢警示執行個體,在 Azure 入口網站外部建立自訂檢視,或分析警示以識別模式和趨勢。 建議您使用 Azure Resource Graph 搭配 'AlertsManagementResources' 架構管理多個訂閱之間的警示。 如需範例查詢,請參閱 Azure 監視器的 Azure Resource Graph 範例查詢

您可以使用 Azure Resource Graph:

您也可以使用警示管理 REST API 降低規模查詢,或更新引發的警示。

定價

如需詳細定價資訊,請參閱 Azure 監視器定價頁面

後續步驟