共用方式為


使用 Azure 備份 計量監視備份的健康情況 (預覽)

Azure 備份透過 Azure 監視器提供一組內建計量,讓您監視備份的健康情況, 並讓您設定在計量超過定義的閾值時,觸發的警示規則。

Azure 備份提供下列重要功能:

  • 能夠檢視與備份和還原備份專案健康情況相關的現用計量,以及相關聯的趨勢
  • 能夠在這些計量上撰寫自定義警示規則,以有效率地監視備份專案的健康情況
  • 能夠將引發的計量警示路由傳送至 Azure 監視器支援的不同通知通道,例如電子郵件、ITSM、Webhook、邏輯應用程式等。

深入瞭解 Azure 監視器計量

支援的案例

  • 支援下列工作負載類型的內建計量:

    • Azure VM、Azure VM 中的 SQL 資料庫
    • Azure VM 中的 SAP HANA 資料庫
    • Azure 檔案
    • Azure Blob。

    目前不支援 HANA 實例工作負載類型的計量。

  • 您可以一次檢視每個區域和訂用帳戶中所有復原服務保存庫的計量。 目前不支援在 Azure 入口網站 中檢視較大範圍的計量。 相同的限制也適用於設定計量警示規則。

支援的內建計量

Azure 備份目前支援下列計量:

  • 備份健康情況事件:此計量的值代表備份作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 備份作業完成後,Azure 備份服務會建立備份健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。

  • 還原健康情況事件:此計量的值代表還原作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 還原作業完成後,Azure 備份服務會建立還原健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。

注意

我們僅支援 Azure Blob 工作負載的還原健康情況事件,因為備份是連續的,而且這裡沒有備份作業的概念。

根據預設,計數會顯示在保存庫層級。 若要檢視特定備份專案和作業狀態的計數,您可以在任何支援的維度上篩選計量。

下表列出備份健康情況事件和還原健康情況事件計量支援的維度:

維度名稱 說明
數據源標識碼 與作業相關聯之數據源的唯一標識符

  • 針對 AZURE 資源,例如 VM 和檔案,這包含資源的 Azure Resource Manager 識別符(ARM 識別符)。
    例如,/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM


  • 針對 VM 內的 SQL/HANA 資料庫,這包含 VM 的 ARM 識別碼,後面接著資料庫的詳細數據。
    例如,/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb


針對 SQL AG 資料庫備份, [數據源標識符 ] 字段是空的,因為這類案例中沒有數據源(VM)。 若要檢視 AG 內特定資料庫的計量,請使用 [備份實例標識符 ] 字段。
數據源類型 與作業相關聯的數據源類型。 以下是支援的資料來源型態:

  • Microsoft.Compute/virtualMachines (Azure 虛擬機器)


  • 微軟。儲存體/storageAccounts/fileServices/shares (Azure 檔案儲存體)


  • SQLDatabase (Azure VM 中的 SQL)


  • SAPHANADataBase (Azure VM 中的 SAP HANA)
備份實例標識碼 與作業相關聯的備份實例 ARM 識別碼

例如,/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM
備份實例名稱 備份實例的易記名稱,方便閱讀。 格式為 {protectedContainerName};{backupItemFriendlyName}

例如,testStorageAccount;testFileShare
健全狀態 表示作業完成之後備份專案的健全狀況。 它可能需要下列其中一個值:狀況良好、暫時性狀況不良、持續性狀況不良、暫時性降級、持續性降級。

  • 當備份/還原作業成功時,會出現狀態 為 [狀況良好] 的健康情況事件。


  • 因服務錯誤而顯示為作業失敗,且因使用者錯誤而降級為失敗。


  • 當相同備份專案重複發生相同的錯誤時,狀態會從 暫時性狀況不良/降級 變更為 持續性狀況不良/已降級

監視情境

在 Azure 入口網站中檢視計量

若要檢視 Azure 入口網站 中的計量,請遵循下列步驟:

  1. 移至 Azure 入口網站 中的備份中心,然後按單下功能表中的 [計量]。

    Screenshot showing to select Metrics in Backup center.

  2. 選取您要檢視計量的保存庫或保存庫群組。

    目前,您可以檢視計量的最大範圍是:特定訂用帳戶和區域中的所有復原服務保存庫。 例如,TestSubscription1美國東部的所有復原服務保存庫。

  3. 選取計量 以檢視 備份健康情況事件或還原健康情況事件

    這會轉譯圖表,其中顯示保存庫的健康情況事件計數。 您可以使用畫面頂端的篩選來調整時間範圍和匯總粒度。

    Screenshot showing the process to select a metric.

  4. 若要依不同維度篩選計量,請按兩下 [ 新增篩選] 按鈕,然後選取相關的維度值。

    • 例如,如果您想要只查看 Azure VM 備份的健康情況事件計數,請新增篩選 Datasource Type = Microsoft.Compute/virtualMachines
    • 若要檢視保存庫中特定數據源或備份實例的健康情況事件,請使用數據源標識元/備份實例標識符篩選器。
    • 若要只檢視失敗備份的健康情況事件,請選取對應至狀況不良或降級健康狀態的值,以使用 HealthStatus 的篩選條件。

    Screenshot showing the process to filter metrics by different dimensions.

設定計量的警示和通知

若要在您的計量上設定警示和通知,請遵循下列步驟:

  1. 按兩下計量圖表頂端的 [ 新增警示規則 ]。

  2. 選取您要建立警示的範圍。

    範圍限制與檢視計量一節中所述的限制相同。

  3. 選取應引發警示的條件。

    根據預設,某些欄位會根據計量圖表中的選取專案預先填入。 您可以視需要編輯參數。 若要為保存庫中的每個數據源產生個別警示,請使用 計量警示規則中的維度 選取專案。 以下是一些案例:

    • 針對每個資料來源的失敗備份作業引發警示:

      警示規則:如果過去 24 小時內備份健全狀況事件 > 0,就會引發警示:

      • Dimensions[“HealthStatus”]= “Persistent Unhealthy / Transient Health Health Healthy”
      • Dimensions[“DatasourceId”]= “All current and future values”
    • 如果保存庫中的所有備份在當天成功時引發警示:

      警示規則:如果過去 24 小時內的備份健康情況事件 < 1 引發警示:

      • Dimensions["HealthStatus"]="Persistent Unhealthy / Transient Unhealthy / Persistent Degraded / Transient Degraded"

    Screenshot showing the option to select the condition on which the alert should be fired.

    注意

    如果您選取更多維度作為警示規則條件的一部分,成本會增加(這與可能之維度值的唯一組合數目成正比)。 選取更多維度可讓您在引發的警示上取得更多內容。

  4. 若要使用動作群組來設定這些警示的通知,請將動作群組設定為警示規則的一部分,或建立個別的動作規則。

    我們支援各種通知通道,例如電子郵件、ITSM、Webhook、邏輯應用程式、SMS。 深入瞭解動作群組

    Screenshot showing the process to configure notifications for these alerts using Action Groups.

  5. 設定自動解決行為 - 您可以視需要將計量警示設定為 狀態或 狀態。

    • 若要針對每個作業失敗產生警示,不論失敗是因為相同的根本原因(無狀態行為),請取消選取 警示規則中的 [自動解決 警示] 選項。
    • 或者,若要將警示設定為具狀態,請選取相同的複選框。 因此,在範圍引發計量警示時,不會建立新的計量警示。 如果連續三個評估週期的警示產生條件評估為 false,警示就會自動解決。 如果條件再次評估為 true,就會產生新的警示。

深入瞭解 Azure 監視器計量警示的具狀態和無狀態行為。

Screenshot showing the process to configure auto-resolution behavior.

管理警示

若要檢視引發的計量警示,請遵循下列步驟:

  1. 移至備份中心>警示。

  2. 已設定訊號類型 = 計量警示類型 = 篩選。

  3. 按兩下警示以檢視警示的詳細數據,並變更其狀態。

    Screenshot showing the process to view your fired metric alerts.

注意

警示有兩個字段 - 監視條件(已引發/已解決)警示狀態 (New/Ack/Closed)

  • 警示狀態:您可以編輯此欄位(如以下螢幕快照所示)。
  • 監視條件:您無法編輯此欄位。 在服務本身解析警示的案例中,會使用此欄位。 例如,計量警示中的自動解決行為會使用 [ 監視條件 ] 字段來解析警示。

數據源警示和全域警示

根據警示規則設定,引發的警示會出現在備份中心的 [數據源警示] 區段或 [全域警示] 區段底下:

  • 如果警示有與其相關聯的數據源標識符維度,引發的警示會出現在 [數據源警示] 底下
  • 如果警示沒有與其相關聯的數據源標識符維度,引發的警示會出現在 [全域警示] 底下,因為沒有任何將警示系結至特定數據源的資訊存在。

在這裡深入了解數據源和全域警示

注意

目前而言,若為 blob 還原警示,則只有在建立警示規則的情況下,同時選取 datasourceIddatasourceType 維度,才會在資料來源警示下顯示警示。 如果未選取任何維度,警示會出現在全域警示底下。

以程式設計方式存取計量

您可以使用不同的程式設計用戶端,例如 PowerShell、CLI 或 REST API 來存取計量功能。 如需詳細資訊,請參閱 Azure 監視器 REST API 檔

範例警示案例

如果保存庫的所有觸發備份在過去 24 小時內都成功,請引發單一警示

警示規則:如果備份健全狀況事件 < 1 在過去 24 小時內引發警示:

Dimensions[“HealthStatus”] != “Health”

在每個失敗的備份作業之後引發警示

警示規則:如果過去 5 分鐘內的備份健康情況事件 > 0,請引發警示:

  • Dimensions[“HealthStatus”]!= “Health”
  • Dimensions[“DatasourceId”]= “All current and future values”

如果過去 24 小時內相同項目發生連續備份失敗,請引發警示

警示規則:如果備份健全狀況事件 > 1 在過去 24 小時內引發警示:

  • Dimensions[“HealthStatus”]!= “Health”
  • Dimensions[“DatasourceId”]= “All current and future values”

如果過去 24 小時內未針對專案執行任何備份作業,請引發警示

警示規則:如果過去 24 小時內的備份健康情況事件 < 1 引發警示:

Dimensions[“DatasourceId”]= “All current and future values”

下一步