使用 Azure 備份 計量監視備份的健康情況 (預覽)
Azure 備份透過 Azure 監視器提供一組內建計量,讓您監視備份的健康情況, 並讓您設定在計量超過定義的閾值時,觸發的警示規則。
Azure 備份提供下列重要功能:
- 能夠檢視與備份和還原備份專案健康情況相關的現用計量,以及相關聯的趨勢
- 能夠在這些計量上撰寫自定義警示規則,以有效率地監視備份專案的健康情況
- 能夠將引發的計量警示路由傳送至 Azure 監視器支援的不同通知通道,例如電子郵件、ITSM、Webhook、邏輯應用程式等。
支援的案例
支援下列工作負載類型的內建計量:
- Azure VM、Azure VM 中的 SQL 資料庫
- Azure VM 中的 SAP HANA 資料庫
- Azure 檔案
- Azure Blob。
目前不支援 HANA 實例工作負載類型的計量。
您可以一次檢視每個區域和訂用帳戶中所有復原服務保存庫的計量。 目前不支援在 Azure 入口網站 中檢視較大範圍的計量。 相同的限制也適用於設定計量警示規則。
支援的內建計量
Azure 備份目前支援下列計量:
備份健康情況事件:此計量的值代表備份作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 備份作業完成後,Azure 備份服務會建立備份健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。
還原健康情況事件:此計量的值代表還原作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 還原作業完成後,Azure 備份服務會建立還原健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。
注意
我們僅支援 Azure Blob 工作負載的還原健康情況事件,因為備份是連續的,而且這裡沒有備份作業的概念。
根據預設,計數會顯示在保存庫層級。 若要檢視特定備份專案和作業狀態的計數,您可以在任何支援的維度上篩選計量。
下表列出備份健康情況事件和還原健康情況事件計量支援的維度:
維度名稱 | 說明 |
---|---|
數據源標識碼 | 與作業相關聯之數據源的唯一標識符。
針對 SQL AG 資料庫備份, [數據源標識符 ] 字段是空的,因為這類案例中沒有數據源(VM)。 若要檢視 AG 內特定資料庫的計量,請使用 [備份實例標識符 ] 字段。 |
數據源類型 | 與作業相關聯的數據源類型。 以下是支援的資料來源型態:
|
備份實例標識碼 | 與作業相關聯的備份實例 ARM 識別碼。 例如, /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM |
備份實例名稱 | 備份實例的易記名稱,方便閱讀。 格式為 {protectedContainerName};{backupItemFriendlyName} 。 例如, testStorageAccount;testFileShare |
健全狀態 | 表示作業完成之後備份專案的健全狀況。 它可能需要下列其中一個值:狀況良好、暫時性狀況不良、持續性狀況不良、暫時性降級、持續性降級。
|
監視情境
在 Azure 入口網站中檢視計量
若要檢視 Azure 入口網站 中的計量,請遵循下列步驟:
移至 Azure 入口網站 中的備份中心,然後按單下功能表中的 [計量]。
選取您要檢視計量的保存庫或保存庫群組。
目前,您可以檢視計量的最大範圍是:特定訂用帳戶和區域中的所有復原服務保存庫。 例如,TestSubscription1 中美國東部的所有復原服務保存庫。
選取計量 以檢視 備份健康情況事件或還原健康情況事件。
這會轉譯圖表,其中顯示保存庫的健康情況事件計數。 您可以使用畫面頂端的篩選來調整時間範圍和匯總粒度。
若要依不同維度篩選計量,請按兩下 [ 新增篩選] 按鈕,然後選取相關的維度值。
- 例如,如果您想要只查看 Azure VM 備份的健康情況事件計數,請新增篩選
Datasource Type = Microsoft.Compute/virtualMachines
。 - 若要檢視保存庫中特定數據源或備份實例的健康情況事件,請使用數據源標識元/備份實例標識符篩選器。
- 若要只檢視失敗備份的健康情況事件,請選取對應至狀況不良或降級健康狀態的值,以使用 HealthStatus 的篩選條件。
- 例如,如果您想要只查看 Azure VM 備份的健康情況事件計數,請新增篩選
設定計量的警示和通知
若要在您的計量上設定警示和通知,請遵循下列步驟:
按兩下計量圖表頂端的 [ 新增警示規則 ]。
選取您要建立警示的範圍。
範圍限制與檢視計量一節中所述的限制相同。選取應引發警示的條件。
根據預設,某些欄位會根據計量圖表中的選取專案預先填入。 您可以視需要編輯參數。 若要為保存庫中的每個數據源產生個別警示,請使用 計量警示規則中的維度 選取專案。 以下是一些案例:針對每個資料來源的失敗備份作業引發警示:
警示規則:如果過去 24 小時內備份健全狀況事件 > 0,就會引發警示:
- Dimensions[“HealthStatus”]= “Persistent Unhealthy / Transient Health Health Healthy”
- Dimensions[“DatasourceId”]= “All current and future values”
如果保存庫中的所有備份在當天成功時引發警示:
警示規則:如果過去 24 小時內的備份健康情況事件 < 1 引發警示:
- Dimensions["HealthStatus"]="Persistent Unhealthy / Transient Unhealthy / Persistent Degraded / Transient Degraded"
注意
如果您選取更多維度作為警示規則條件的一部分,成本會增加(這與可能之維度值的唯一組合數目成正比)。 選取更多維度可讓您在引發的警示上取得更多內容。
若要使用動作群組來設定這些警示的通知,請將動作群組設定為警示規則的一部分,或建立個別的動作規則。
我們支援各種通知通道,例如電子郵件、ITSM、Webhook、邏輯應用程式、SMS。 深入瞭解動作群組。
設定自動解決行為 - 您可以視需要將計量警示設定為 無 狀態或 具 狀態。
- 若要針對每個作業失敗產生警示,不論失敗是因為相同的根本原因(無狀態行為),請取消選取 警示規則中的 [自動解決 警示] 選項。
- 或者,若要將警示設定為具狀態,請選取相同的複選框。 因此,在範圍引發計量警示時,不會建立新的計量警示。 如果連續三個評估週期的警示產生條件評估為 false,警示就會自動解決。 如果條件再次評估為 true,就會產生新的警示。
深入瞭解 Azure 監視器計量警示的具狀態和無狀態行為。
管理警示
若要檢視引發的計量警示,請遵循下列步驟:
注意
警示有兩個字段 - 監視條件(已引發/已解決) 和 警示狀態 (New/Ack/Closed) 。
- 警示狀態:您可以編輯此欄位(如以下螢幕快照所示)。
- 監視條件:您無法編輯此欄位。 在服務本身解析警示的案例中,會使用此欄位。 例如,計量警示中的自動解決行為會使用 [ 監視條件 ] 字段來解析警示。
數據源警示和全域警示
根據警示規則設定,引發的警示會出現在備份中心的 [數據源警示] 區段或 [全域警示] 區段底下:
- 如果警示有與其相關聯的數據源標識符維度,引發的警示會出現在 [數據源警示] 底下。
- 如果警示沒有與其相關聯的數據源標識符維度,引發的警示會出現在 [全域警示] 底下,因為沒有任何將警示系結至特定數據源的資訊存在。
注意
目前而言,若為 blob 還原警示,則只有在建立警示規則的情況下,同時選取 datasourceId 和 datasourceType 維度,才會在資料來源警示下顯示警示。 如果未選取任何維度,警示會出現在全域警示底下。
以程式設計方式存取計量
您可以使用不同的程式設計用戶端,例如 PowerShell、CLI 或 REST API 來存取計量功能。 如需詳細資訊,請參閱 Azure 監視器 REST API 檔 。
範例警示案例
如果保存庫的所有觸發備份在過去 24 小時內都成功,請引發單一警示
警示規則:如果備份健全狀況事件 < 1 在過去 24 小時內引發警示:
Dimensions[“HealthStatus”] != “Health”
在每個失敗的備份作業之後引發警示
警示規則:如果過去 5 分鐘內的備份健康情況事件 > 0,請引發警示:
- Dimensions[“HealthStatus”]!= “Health”
- Dimensions[“DatasourceId”]= “All current and future values”
如果過去 24 小時內相同項目發生連續備份失敗,請引發警示
警示規則:如果備份健全狀況事件 > 1 在過去 24 小時內引發警示:
- Dimensions[“HealthStatus”]!= “Health”
- Dimensions[“DatasourceId”]= “All current and future values”
如果過去 24 小時內未針對專案執行任何備份作業,請引發警示
警示規則:如果過去 24 小時內的備份健康情況事件 < 1 引發警示:
Dimensions[“DatasourceId”]= “All current and future values”
下一步
- 深入瞭解 Azure 備份 中的監視和報告。
- 深入瞭解 Azure 監視器計量。
- 深入瞭解 Azure 警示。