Monitorize a saúde das suas cópias de segurança utilizando Azure Backup Métricas (pré-visualização)

Azure Backup fornece um conjunto de métricas incorporadas através do Azure Monitor que lhe permitem monitorizar a saúde das suas cópias de segurança. Também permite configurar regras de alerta que desencadeiam quando as métricas excedem os limiares definidos.

Azure Backup oferece as seguintes capacidades-chave:

  • Capacidade de visualizar métricas fora da caixa relacionadas com o backup e restaurar a saúde dos seus itens de backup juntamente com as tendências associadas
  • Capacidade de escrever regras de alerta personalizado nestas métricas para monitorizar eficientemente a saúde dos seus itens de backup
  • Capacidade de encaminhar alertas métricos disparados para diferentes canais de notificação suportados pelo Azure Monitor, tais como e-mail, ITSM, webhook, aplicações lógicas, e assim por diante.

Saiba mais sobre as métricas do Azure Monitor.

Cenários suportados

  • Suporta métricas incorporadas para os seguintes tipos de carga de trabalho:

    • Azure VM, bases de dados SQL em Azure VM
    • Bases de dados SAP HANA em Azure VM
    • Ficheiros do Azure
    • Azure Blobs.

    Atualmente, as métricas do tipo de carga de trabalho de instância HANA não são suportadas.

  • As métricas podem ser vistas para todos os cofres dos Serviços de Recuperação em cada região e subscrição de cada vez. Atualmente, não são suportadas métricas de visualização para um âmbito maior no portal do Azure. Os mesmos limites são também aplicáveis às regras de alerta métricas de configuração.

Métricas incorporadas suportadas

Atualmente, Azure Backup suporta as seguintes métricas:

  • Eventos de Saúde de Reserva: O valor desta métrica representa a contagem de eventos de saúde relativos à saúde do trabalho de reserva, que foram despedidos para o cofre dentro de um tempo específico. Quando um trabalho de reserva termina, o serviço de Azure Backup cria um evento de saúde de reserva. Com base no estatuto de trabalho (como bem sucedido ou falhado), as dimensões associadas ao evento variam.

  • Restaurar eventos de saúde: O valor desta métrica representa a contagem de eventos de saúde relativos a restaurar a saúde do trabalho, que foram disparados para o cofre dentro de um tempo específico. Quando um trabalho de restauração termina, o serviço de Azure Backup cria um evento de saúde restaurado. Com base no estatuto de trabalho (como bem sucedido ou falhado), as dimensões associadas ao evento variam.

Nota

Apoiamos a Restauração de Eventos de Saúde apenas para a carga de trabalho do Azure Blobs, uma vez que os backups são contínuos, e não há noção de trabalhos de reserva aqui.

Por defeito, as contagens são a superfície ao nível do cofre. Para visualizar as contagens para um determinado item de backup e estado de trabalho, pode filtrar as métricas em qualquer uma das dimensões suportadas.

A tabela a seguir enumera as dimensões que as métricas de Backup Health Events e Restore Health Events suportam:

Nome da dimensão Descrição
ID de fonte de dados A identificação única do dados associado ao trabalho.

  • Para os recursos Azure, tais como VMs e Ficheiros, este contém o Azure Resource Manager ID (ARM ID) do recurso.
    Por exemplo, /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM


  • Para as bases de dados SQL/HANA dentro de VMs, isto contém o ID ARM do VM seguido de detalhes da base de dados.
    Por exemplo, /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb


Para a cópia de segurança da base de dados SQL AG, o campo de ID de datasource está vazio, uma vez que não existe qualquer fonte de dados (VM) nesses cenários. Para visualizar as métricas de uma determinada base de dados dentro de uma AG, utilize o campo de identificação de identificação de instância de cópia de segurança .
Tipo de fonte de dados O tipo de fonte de dados associada ao trabalho. Seguem-se os tipos de fontes de dados suportados:

  • Microsoft.Compute/virtualMachines (Azure Máquinas Virtuais)


  • Microsoft.Storage/storageAcounts/fileServices/shares (Ficheiros do Azure)


  • SQLDatabase (SQL em Azure VM)


  • SAPHANADataBase (SAPHANA HANA em Azure VM)
ID de instância de backup A identificação da ARM da instância de apoio associada ao trabalho.

Por exemplo, /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM
Nome da instância de backup Nome amigável da instância de backup para fácil legibilidade. É do formato {protectedContainerName};{backupItemFriendlyName}.

Por exemplo, testStorageAccount;testFileShare
Estado de Funcionamento Representa a saúde do item de reserva após o trabalho ter terminado. Pode levar um dos seguintes valores: Saudável, Transitório Insalubre, Persistente Insalubre, Transitório Degradado, Persistente Degradado.

  • Quando um trabalho de backup/restauro é bem sucedido, aparece um evento de saúde com estatuto Healthy .


  • O insalubre parece falhar o trabalho devido a erros de serviço, e o Degraded aparece em falhas devido a erros do utilizador.


  • Quando o mesmo erro acontece repetidamente para o mesmo item de backup, o estado muda de Transiente Insalubre/Degradado para Persistente Insalubre/Degradado.

Cenários de monitorização

Ver métricas no portal do Azure

Para ver as métricas no portal do Azure, siga os passos abaixo:

  1. Vá ao centro de backup no portal do Azure e clique em Métricas a partir do menu.

    Screenshot mostrando para selecionar métricas no centro de backup.

  2. Selecione um cofre ou um grupo de cofres para os quais pretende ver métricas.

    Atualmente, o âmbito máximo para o qual pode ver métricas é: Cofres de todos os Serviços de Recuperação numa determinada subscrição e região. Por exemplo, cofres de todos os serviços de recuperação no Leste dos EUA em TestSubscription1.

  3. Selecione uma métrica para visualizar Eventos de Saúde de Backup ou Restaurar Eventos de Saúde.

    Isto torna um gráfico que mostra a contagem de eventos de saúde para o cofre(s). Pode ajustar o intervalo de tempo e a granularidade agregação utilizando os filtros na parte superior do ecrã.

    Screenshot mostrando o processo para selecionar uma métrica.

  4. Para filtrar métricas por diferentes dimensões, clique no botão Adicionar Filtro e selecione os valores de dimensão relevantes.

    • Por exemplo, se desejar ver que o evento de saúde conta apenas para cópias de segurança Azure VM, adicione um filtro Datasource Type = Microsoft.Compute/virtualMachines.
    • Para visualizar eventos de saúde para uma determinada fonte de dados ou uma instância de backup dentro do cofre, utilize os filtros de identificação de identificação/identificação de dados/backup.
    • Para visualizar eventos de saúde apenas para cópias de segurança falhadas, utilize um filtro no HealthStatus, selecionando os valores correspondentes a um estado de saúde pouco saudável ou degradado.

    Screenshot mostrando o processo para filtrar métricas por diferentes dimensões.

Configurar alertas e notificações nas métricas

Para configurar alertas e notificações nas suas métricas, siga estes passos:

  1. Clique em Nova Regra de Alerta no topo das tabelas métricas.

  2. Selecione o âmbito para o qual pretende criar alertas.

    Os limites de âmbito são os mesmos que os limites descritos na secção ver métricas .

  3. Selecione a condição em que o alerta deve ser disparado.

    Por padrão, alguns campos são pré-povoados com base nas seleções do gráfico métrico. Pode editar os parâmetros conforme necessário. Para gerar alertas individuais para cada fonte de dados no cofre, utilize a seleção de dimensões na regra dos alertas métricos. Seguem-se alguns cenários:

    • Alertas de disparo sobre trabalhos de backup falhados para cada fonte de dados:

      Regra de alerta: Em chamas um alerta se os Eventos de > Saúde de Reserva 0 nas últimas 24 horas para:

      • Dimensões["HealthStatus"]= "Persistente Insalubre / Transitório Insalubre"
      • Dimensões["DatasourceId"]= "Todos os valores atuais e futuros"
    • Alertas de disparo se todos os backups no cofre foram bem sucedidos para o dia:

      Regra de alerta: Em chamas um alerta se os Eventos de < Saúde de Backup 1 nas últimas 24 horas para:

      • Dimensões["HealthStatus"]="Persistente Insalubre / Transitório Insalubre / Persistente Degradado / Transitório Degradado / Transitório Degradado"

    Screenshot mostrando a opção de selecionar a condição em que o alerta deve ser disparado.

    Nota

    Se selecionar mais dimensões como parte da condição da regra de alerta, o custo aumenta (isso é proporcional ao número de combinações únicas de valores de dimensão possíveis). A seleção de mais dimensões permite-lhe obter mais contexto num alerta de disparo.

  4. Para configurar notificações para estes alertas utilizando grupos de ação, configure um Grupo de Ação como parte da regra de alerta ou crie uma regra de ação separada.

    Apoiamos vários canais de notificação, tais como e-mail, ITSM, webhook, Logic App, SMS. Saiba mais sobre grupos de ação.

    Screenshot mostrando o processo para configurar notificações para estes alertas usando Grupos de Ação.

  5. Configure o comportamento de resolução automática - Pode configurar alertas métricos tão apátridas ou imponentes conforme necessário.

    • Para gerar um alerta sobre todas as falhas de trabalho, independentemente da falha, deve-se à mesma causa subjacente (comportamento apátrida), desmarcar a opção de alerta de resolução automática na regra de alerta.
    • Alternadamente, para configurar os alertas como imponentes, selecione a mesma caixa de verificação. Portanto, quando um alerta métrico é disparado sobre o âmbito, outra falha não criará um novo alerta métrico. O alerta fica resolvido automaticamente se a condição de geração de alerta avaliar o falso para três ciclos de avaliação sucessivos. Novos alertas são gerados se a condição reavaliar a verdade novamente.

Saiba mais sobre o comportamento apátrida e apátrida dos alertas métricos do Azure Monitor.

Screenshot mostrando o processo para configurar o comportamento de resolução automática.

Gerir Alertas

Para ver os seus alertas métricos disparados, siga estes passos:

  1. Vá para backup center>alerts.

  2. Filtragem paramétricatipo de = sinal e tipo = de alertaconfigurado.

  3. Clique num alerta para ver mais detalhes sobre o alerta e alterar o seu estado.

    Screenshot mostrando o processo para visualizar os seus alertas métricos disparados.

Nota

O alerta tem dois campos - Monitore a condição (disparado/resolvido) e o Estado de Alerta (Novo/Ack/Fechado).

  • Estado de alerta: Pode editar este campo (como mostrado na imagem abaixo).
  • Condição do monitor: Não pode editar este campo. Este campo é mais utilizado em cenários onde o próprio serviço resolve o alerta. Por exemplo, o comportamento de resolução automática em alertas métricos utiliza o campo de condição do Monitor para resolver um alerta.

Alertas de fontes de dados e alertas globais

Com base na configuração das regras de alerta, o alerta disparado aparece na secção Alertas de Fonte de Dados ou na secção Alertas Globais no centro de backup:

  • Se o alerta tiver uma dimensão de ID de fonte de dados associada a ele, o alerta disparado aparece em Alertas de Fonte de Dados.
  • Se o alerta não tiver uma dimensão de ID de fonte de dados associada a ele, o alerta de disparo aparece nos Alertas Globais , uma vez que não existe nenhuma informação que adcema a uma fonte de dados específica.

Saiba mais sobre fonte de dados e alertas globais aqui

Nota

Atualmente, em caso de alertas de restauro de blob, os alertas só aparecem sob alertas de fonte de dados se selecionar ambas as dimensões - datasourceId e datasourceType enquanto cria a regra de alerta. Se alguma dimensão não for selecionada, os alertas aparecem sob alertas globais.

Aceder a métricas programáticamente

Pode utilizar os diferentes clientes programáticos, tais como PowerShell, CLI ou REST API, para aceder à funcionalidade métricas. Consulte a documentação da API do Monitor Azure para obter mais detalhes.

Cenários de alerta de amostra

Dispare um único alerta se todos os backups desencadeados para um cofre foram bem sucedidos nas últimas 24 horas

Regra de alerta: Em chamas um alerta se os Eventos de < Saúde de Backup 1 nas últimas 24 horas:

Dimensões["HealthStatus"] != "Saudável"

Dispare um alerta depois de cada trabalho de backup falhado

Regra de alerta: Em chamas um alerta se os Eventos de > Saúde de Backup 0 nos últimos 5 minutos para:

  • Dimensões["HealthStatus"]!= "Saudável"
  • Dimensões["DatasourceId"]= "Todos os valores atuais e futuros"

Despeçam um alerta se houver falhas consecutivas de backup para o mesmo item nas últimas 24 horas

Regra de alerta: Em chamas um alerta se os Eventos de > Saúde de Backup 1 nas últimas 24 horas:

  • Dimensões["HealthStatus"]!= "Saudável"
  • Dimensões["DatasourceId"]= "Todos os valores atuais e futuros"

Dispare um alerta se nenhum trabalho de reserva foi executado para um item nas últimas 24 horas

Regra de alerta: Em chamas um alerta se os Eventos de < Saúde de Backup 1 nas últimas 24 horas para:

Dimensões["DatasourceId"]= "Todos os valores atuais e futuros"

Passos seguintes