Compartilhar via


Recomendações para coletar dados de desempenho

Aplica-se a esta recomendação de lista de verificação de Eficiência de Desempenho do Azure Well-Architected Framework:

PE: 04 Coletar dados de desempenho. Os componentes e fluxos de carga de trabalho devem fornecer métricas e logs automáticos, contínuos e significativos. Colete dados em diferentes níveis da carga de trabalho, como os níveis de aplicativo, plataforma, dados e sistema operacional.

Coletar dados de desempenho é o processo de reunir métricas e logs que fornecem informações sobre o desempenho de uma carga de trabalho. Esses dados incluem valores numéricos, que são conhecidos como métricas. As métricas descrevem o estado do sistema em um determinado momento. Também inclui logs que contêm diferentes tipos de dados organizados em registros.

Ao coletar dados de desempenho, você pode monitorar e analisar o desempenho de uma carga de trabalho. Você pode usar essas informações para identificar gargalos de desempenho, solucionar problemas, otimizar a alocação de recursos e embasar decisões em dados para melhorar a eficiência geral do desempenho da carga de trabalho.

Sem insights orientados por dados, você pode não estar ciente de problemas de desempenho subjacentes ou oportunidades de otimização. Os resultados potenciais incluem tempos de resposta mais lentos, taxa de transferência reduzida, maior uso de recursos e, por fim, uma experiência de usuário abaixo do ideal. Além disso, a falta de dados de desempenho dificulta o diagnóstico e a solução de problemas em tempo hábil, levando a um tempo de inatividade prolongado e produtividade reduzida.

Definições

Termo Definição
Logs de atividades Logs que rastreiam operações de gerenciamento em recursos, como a exclusão de um recurso.
Logs de aplicativo Logs que rastreiam informações sobre eventos de aplicativo, erros e outras atividades, como entradas de uso e falhas de conexão com o banco de dados.
Ferramenta de monitoramento de desempenho de aplicativos (APM) Uma ferramenta que monitora e relata o desempenho de um aplicativo.
Instrumentação de código A captura direta ou indireta de métricas de desempenho da perspectiva do código do aplicativo. As métricas capturadas incluem métricas de fluxo, uso de recursos e métricas específicas da linguagem ou do tempo de execução.
Rastreamento distribuído Coleta e correlação de métricas entre componentes de carga de trabalho distribuídos.
Coletor de métricas Um destino de armazenamento para suas métricas que correlaciona dados de séries temporais para análise.
Logs de plataforma Dados de diagnóstico e auditoria que incluem logs de recursos, logs de atividades e logs de auditoria.
Métricas de plataforma Valores numéricos que registram o desempenho da carga de trabalho em um determinado momento.
Logs de recursos Dados gerados por um sistema. Ele fornece informações sobre o estado do sistema.
Erros de Rx/Tx O número de erros de recepção e erros de transmissão em uma interface de rede.
Registro em log estruturado Definir um formato significativo para registrar mensagens, normalmente como pares chave-valor.

Principais estratégias de design

A otimização de desempenho requer dados para medir o desempenho atual de uma carga de trabalho ou de um fluxo em relação às suas metas de desempenho. Você precisa coletar a quantidade e a diversidade certas de dados para medir o desempenho do código e da infraestrutura em relação às metas de desempenho. Certifique-se de que cada componente e fluxo dentro da carga de trabalho gere automaticamente métricas e logs contínuos e significativos. Você precisa obter esses dados de diversos níveis, como aplicativo, plataforma, armazenamento e sistema operacional. A coleta abrangente de dados de desempenho permite uma compreensão holística do desempenho, permitindo a identificação precisa de ineficiências e caminhos para melhorias.

Centralizar a coleta de dados de desempenho

Centralizar métricas e logs de desempenho é o processo de coletar métricas de desempenho e logs de várias fontes e armazená-las em um local centralizado. Crie um coletor de métricas centralizado e um coletor de log centralizado. Essa centralização permite fácil acesso, análise e monitoramento de métricas de desempenho e logs em diferentes sistemas e componentes. Ao centralizar métricas e logs, você obtém visibilidade do desempenho de sua carga de trabalho. Escolha uma plataforma ou ferramenta adequada que possa agregar e armazenar métricas e logs de desempenho da carga de trabalho.

Compensação: entenda o custo de coleta de métricas e logs. Em geral, quanto mais métricas e logs você coletar, maior será o custo.

Dados de desempenho do segmento

A segmentação dos dados de desempenho envolve a organização e a categorização de métricas e logs de acordo com sua origem, finalidade ou ambiente. Por exemplo, você deve separar os dados de produção dos dados de não produção ou distinguir entre metas de desempenho e métricas de negócios. A segmentação de dados auxilia na otimização de ambientes específicos, facilita a solução de problemas e reduz as imprecisões no monitoramento de desempenho. Ao manter uma distinção clara entre diferentes tipos de dados, você pode capturar, analisar e responder a métricas relevantes com mais eficiência e alinhar melhor a integridade da carga de trabalho com os objetivos da carga de trabalho. Para segmentar dados de desempenho, considere as seguintes recomendações:

  • Mantenha os dados de produção e os dados de não produção separados. Ao separar os dados por ambiente, você pode garantir o monitoramento e a otimização focados de cada ambiente. Em ambientes de produção, você pode identificar e resolver melhor os problemas de desempenho que afetam diretamente os usuários e as operações de negócios. Em ambientes de não produção, a separação de dados facilita a solução de problemas e o ajuste fino eficazes durante a fase de teste antes da implantação na produção.

  • Use um conjunto de dados em cada ambiente. Não use um conjunto de dados para metas de desempenho e outro conjunto de dados para alertas relacionados às metas de desempenho. O uso de diferentes conjuntos de dados leva a alertas imprecisos que prejudicam a eficácia do monitoramento de desempenho.

  • Separe as metas de desempenho e as métricas de negócios. As equipes de operações e desenvolvimento usam metas de desempenho para monitorar a integridade da carga de trabalho e atender às metas de negócios. As métricas de negócios estão relacionadas a metas de negócios ou relatórios de clientes. Capture métricas de negócios em um fluxo de dados separado, mesmo que os dados se sobreponham diretamente. A separação oferece flexibilidade para capturar os dados certos e analisá-los de forma independente.

Definir políticas de retenção

As políticas de retenção determinam a duração da manutenção dos dados de desempenho. Estabelecer essas políticas ajuda na gestão eficiente do armazenamento e garante que apenas os dados necessários estejam acessíveis para análise. Essas políticas contribuem para um melhor desempenho e atendem aos padrões de conformidade. Você deve configurar políticas de retenção para os dados de log e métricas para permitir a solução de problemas e o monitoramento eficazes em todos os ambientes. Por exemplo, os logs e as métricas podem precisar ser mantidos por mais tempo em um ambiente de produção do que no ambiente de teste. O período de retenção deve corresponder aos requisitos e aos regulamentos de conformidade da sua organização. Decida por quanto tempo reter os dados para fins de análise e auditoria. Arquive os dados que você não precisa para análise imediata.

Coletar dados de desempenho do aplicativo

A coleta de dados do aplicativo envolve o monitoramento e a análise das métricas de desempenho de um aplicativo, como taxa de transferência, latência e tempos de conclusão, coletadas principalmente por meio do código de instrumentação. Os dados de desempenho do aplicativo fornecem informações valiosas sobre a integridade e o desempenho de um aplicativo. Ao monitorar e analisar dados de desempenho, você pode identificar e solucionar problemas, otimizar o desempenho do aplicativo e tomar decisões informadas para seu aplicativo.

Código do instrumento

Instrumentação refere-se ao processo de incorporação de trechos de código ou integração de ferramentas em um código de aplicativo. A finalidade da instrumentação é capturar dados de desempenho enquanto o aplicativo é executado. É essencial reunir métricas que destaquem as operações críticas do aplicativo. Concentre-se em métricas como taxa de transferência, latência e tempo de conclusão. É importante diferenciar entre operações relacionadas aos negócios e operações que não são. Para dados pertencentes a operações de negócios, certifique-se de que seus metadados estejam estruturados de forma a permitir rastreamento e armazenamento distintos. O principal motivo para a instrumentação de código é coletar dados sobre como o aplicativo lida com sua carga de trabalho. Proporciona os seguintes benefícios:

  • Identificando gargalos de desempenho: ao rastrear métricas como uso de CPU e uso de memória, você pode identificar gargalos e otimizar o código de acordo.

  • Avaliando o comportamento do sistema sob uma carga: você pode ver como o aplicativo é executado em diferentes cargas de trabalho e cenários de estresse. Esses dados podem ajudá-lo a identificar problemas relacionados à escalabilidade, simultaneidade e uso de recursos.

  • Acompanhamento da integridade e disponibilidade do aplicativo: como os principais indicadores de desempenho são monitorados em tempo real, você pode receber alertas sobre possíveis problemas que afetam o desempenho e a disponibilidade do aplicativo.

  • Melhorar a experiência do usuário: você pode obter insights sobre como os usuários interagem com o aplicativo. Use essas informações para otimizar a experiência do usuário e identificar áreas de melhoria.

  • Planeje a capacidade e aloque recursos: os dados de desempenho que a instrumentação coleta podem fornecer informações valiosas sobre os requisitos de recursos de um aplicativo. Essas informações podem informar suas decisões sobre capacidade de planejamento e alocação de recursos.

Ao instrumentar o código para monitoramento de desempenho, considere as seguintes estratégias:

  • Use ferramentas de APM: as ferramentas de APM podem coletar e analisar dados de desempenho, incluindo métricas, rastreamentos e logs. As ferramentas de APM oferecem recursos como instrumentação em nível de código, rastreamento de transações e perfil de desempenho.

  • Use estruturas de log e rastreamento: as estruturas de log e rastreamento são ferramentas ou bibliotecas que os desenvolvedores integram em seus aplicativos para facilitar o registro em log e o rastreamento. Essas estruturas fornecem funções para gerar logs, solicitações de rastreamento e, às vezes, até formatar ou transportar os dados gerados. Ao incorporar estruturas de log e rastreamento na base de código, os desenvolvedores podem capturar dados relevantes durante o tempo de execução. Os dados podem incluir informações sobre o caminho de execução, E/S e desempenho.

  • Instrumentação personalizada: os desenvolvedores podem adicionar código personalizado para coletar métricas de desempenho exclusivas para seu aplicativo e carga de trabalho. A instrumentação personalizada pode medir tempos de execução, rastrear o uso de recursos ou capturar eventos específicos. Escreva instrumentação de código personalizado somente quando as métricas da plataforma forem insuficientes. Em algumas situações, o recurso de plataforma pode medir perspectivas agregadas ou até mesmo granulares do seu aplicativo. Avalie a questão de duplicar esse esforço usando código personalizado em relação a compensações de código em excesso ou dependência de um recurso da plataforma.

  • Capture os tempos de transação. A captura de tempos de transação está relacionada à medição dos tempos de ponta a ponta para as principais funções técnicas como parte do monitoramento de desempenho. As métricas no nível do aplicativo devem incluir tempos de transação de ponta a ponta. Esses tempos de transação devem abranger as principais funções técnicas, como consultas de banco de dados, tempos de resposta para chamadas de API externas e taxas de falha das etapas de processamento.

  • Use padrões de telemetria. Considere o uso de bibliotecas de instrumentação de ferramentas de APM e ferramentas criadas em torno de um padrão de telemetria, como OpenTelemetry.

Habilitar o rastreamento distribuído

O rastreamento distribuído é uma técnica usada para rastrear e monitorar solicitações à medida que elas fluem por um sistema distribuído. Ele permite que você rastreie o caminho de uma solicitação à medida que ela viaja por vários serviços e componentes, fornecendo informações valiosas sobre o desempenho e a eficiência de sua carga de trabalho. O rastreamento distribuído é importante para a eficiência do desempenho porque ajuda a identificar gargalos, problemas de latência e áreas para otimização em um sistema distribuído. Você pode identificar onde ocorrem atrasos ou ineficiências e tomar as medidas apropriadas para melhorar o desempenho visualizando o fluxo de uma solicitação. Siga estas etapas para habilitar o rastreamento distribuído:

  1. Comece instrumentando seus aplicativos e serviços para gerar dados de rastreamento. Use bibliotecas ou estruturas que ofereçam suporte ao rastreamento distribuído, como OpenTelemetry.

  2. Certifique-se de que as informações de rastreamento sejam propagadas entre os limites de serviço. Normalmente, você deve passar uma ID de rastreamento exclusiva e outras informações contextuais com cada solicitação.

  3. Configure um sistema centralizado de coleta de rastreamento. Este sistema coleta e armazena os dados de rastreamento gerados por seus aplicativos e serviços.

  4. Use os dados de rastreamento coletados para visualizar o fluxo de solicitações de ponta a ponta e analisar as características de desempenho do seu sistema distribuído.

Coletar logs do aplicativo

Quando você instrumenta o código, uma das principais saídas deve ser os logs do aplicativo. O registro em log ajuda você a entender como o aplicativo é executado em vários ambientes. Os logs do aplicativo registram as condições que produzem eventos do aplicativo. Colete logs de aplicativos em todos os ambientes de aplicativos. As entradas de log correspondentes no aplicativo devem capturar uma ID de correlação das respectivas transações desse aplicativo. A ID de correlação deve correlacionar eventos de log do aplicativo em fluxos de aplicativos críticos, como entrada do usuário. Use essa correlação para avaliar a integridade dos principais cenários no contexto de destinos e requisitos não funcionais.

Você deve usar o log estruturado. O registro estruturado acelera a análise e a análise de logs. Isso torna os logs mais fáceis de indexar, consultar e relatar sem complexidade. Adicione e use uma biblioteca de log estruturada no código do aplicativo. Às vezes, as entradas de log podem ajudá-lo a correlacionar dados que você não poderia correlacionar por outros meios.

Coletar dados de desempenho de recursos

Ao coletar dados de desempenho de recursos, você pode obter insights sobre a integridade e o comportamento de sua carga de trabalho. Os dados de desempenho de recursos fornecem informações sobre o uso de recursos, que é fundamental para o planejamento de capacidade. Esses dados também fornecem insights sobre a integridade de uma carga de trabalho e podem ajudá-lo a detectar problemas e solucionar problemas. Considere as seguintes recomendações:

  • Colete métricas e logs para cada recurso. Cada serviço do Azure tem um conjunto de métricas exclusivo para a funcionalidade do recurso. Essas métricas ajudam você a entender a integridade e o desempenho do recurso. Adicione uma configuração de diagnóstico para cada recurso para enviar métricas para um local que sua equipe de carga de trabalho possa acessar à medida que cria alertas e painéis. Os dados de métrica estão disponíveis para acesso de curto prazo. Para acesso de longo prazo ou para acesso de um sistema que está fora do Azure Monitor, envie os dados de métrica para o coletor unificado para o local de acesso.

  • Use ferramentas de plataforma. Inspire-se em soluções de monitoramento internas e integradas, como o Azure Monitor Insights. Essas ferramentas simplificam as operações de desempenho. Considere as ferramentas da plataforma ao selecionar uma plataforma e investir em ferramentas ou relatórios personalizados.

  • Monitore o tráfego de rede. Monitorar o tráfego de rede significa rastrear e analisar o fluxo e os padrões de dados à medida que eles se movem pelos caminhos da rede. Colete a análise de tráfego e monitore o tráfego que atravessa os limites da sub-rede. Sua meta é analisar e otimizar o desempenho da rede.

Coletar dados de banco de dados e armazenamento

Muitos sistemas de banco de dados e armazenamento fornecem suas próprias ferramentas de monitoramento. Essas ferramentas coletam dados de desempenho específicos para esses sistemas. Os sistemas de banco de dados e armazenamento frequentemente geram logs contendo eventos e indicadores relacionados ao desempenho. Colete dados de banco de dados e de desempenho de armazenamento para identificar gargalos, diagnosticar problemas e tomar decisões informadas visando melhorar o desempenho geral e a confiabilidade da carga de trabalho. Considere coletar os seguintes tipos de dados de desempenho:

  • Taxa de transferência: a taxa de transferência mede a quantidade de dados lidos ou gravados no sistema de armazenamento durante um período de tempo. Os dados de taxa de transferência indicam os recursos de transferência de dados.

  • Latência: a latência mede quanto tempo duram as operações de armazenamento. Os dados de latência indicam a capacidade de resposta do sistema de armazenamento.

  • IOPS (operações de I/O por segundo): dados sobre o número de operações de leitura ou gravação que o sistema de armazenamento pode executar em um segundo. Os dados de IOPS indicam o throughput e a capacidade de resposta do sistema de armazenamento.

  • Uso da capacidade: o uso da capacidade é a quantidade de capacidade de armazenamento usada e a quantidade disponível. Os dados de uso de capacidade ajudam as organizações a planejar futuras necessidades de armazenamento.

Para bancos de dados, você também deve coletar métricas específicas do banco de dados:

  • Desempenho da consulta: dados sobre o tempo de execução, o uso de recursos e a eficiência das consultas de banco de dados. Consultas de banco de dados lentas ou ineficientes podem diminuir significativamente uma carga de trabalho. Procure consultas lentas e executadas com frequência.

  • Desempenho da transação: dados sobre o desempenho das transações do banco de dados, como duração da transação, simultaneidade e contenção de bloqueio.

  • Desempenho do índice: dados sobre o desempenho de índices de banco de dados, como fragmentação de índice, estatísticas de uso e otimização de consulta.

  • Uso de recursos: dados que incluem CPU, memória, espaço em disco, E/S e largura de banda de rede.

  • Métricas de conexão: métricas que rastreiam o número de conexões ativas, anuladas e com falha. Altas taxas de falha podem indicar problemas de rede ou podem indicar que o banco de dados atingiu seu número máximo de conexões.

  • Taxas de transação: o número de transações que um banco de dados executa por segundo. Uma alteração nas taxas de transação pode indicar problemas de desempenho.

  • Taxas de erro: dados que indicam o desempenho de um banco de dados. Altas taxas de erro podem indicar um problema de desempenho. Colete e analise erros de banco de dados.

Coletar dados do sistema operacional

Uma solução de PaaS (plataforma como serviço) elimina a necessidade de coletar dados de desempenho do sistema operacional. No entanto, se sua carga de trabalho for executada em máquinas virtuais (infraestrutura como serviço), você precisará coletar dados de desempenho sobre o sistema operacional. Você precisa entender a demanda em seu sistema operacional e máquina virtual. Freqüentemente, faça uma amostra dos contadores de desempenho do sistema operacional. Por exemplo, você pode amostrar os contadores de desempenho a cada minuto.

No mínimo, colete dados sobre as seguintes áreas de desempenho.

Área de atuação Processo ou função
CPU - Uso da CPU (modo de usuário ou modo privilegiado)
- Comprimento da fila da CPU (número de processos que estão aguardando o tempo de CPU)
Processo - Contagem de threads do processo
- Contagem de identificadores de processo
Memória - Memória confirmada
- Memória disponível
- Páginas por segundo
- Uso do espaço de troca
Disco - Leitura de disco
- Gravações de disco
- Taxa de transferência de disco
- Uso de espaço em disco
Rede - Taxa de transferência da interface de rede
- Erros de Rx/Tx na interface de rede

Valide e analise dados

Seus dados de desempenho devem estar alinhados com as metas de desempenho. Os dados precisam representar o desempenho da carga de trabalho ou do fluxo de forma completa e precisa no que se refere às metas de desempenho. Por exemplo, o tempo de resposta de um serviço Web tem uma meta de desempenho de 500 ms. Torne uma rotina analisar os dados, pois avaliações frequentes permitem a detecção precoce e a mitigação de problemas de desempenho.

  • Criar alertas. É benéfico ter alertas acionáveis, permitindo a identificação imediata e a correção de problemas de desempenho. Esses alertas devem indicar claramente o limite de desempenho violado, o efeito comercial potencial e os componentes envolvidos. Comece definindo o alerta comum e recomendado. Com o tempo, você pode modificar esses critérios com base em suas necessidades específicas. O objetivo principal desses alertas deve ser prever possíveis quedas de desempenho antes que elas se transformem em problemas significativos. Se você não puder definir um alerta para uma dependência externa, considere criar um método para coletar medidas indiretas, como a duração de uma chamada de dependência.

  • Defina limites de coleta de dados. Determine e defina limites lógicos para o volume de dados coletados e sua duração de retenção. Às vezes, a telemetria pode produzir quantidades esmagadoras de dados. É essencial se concentrar em capturar apenas os indicadores de desempenho mais vitais ou ter um sistema eficiente para extrair insights significativos de seus dados de desempenho.

Facilitação do Azure

Centralização, segmentação e retenção de dados de desempenho: o Azure Monitor coleta e agrega dados de todas as camadas e componentes de sua carga de trabalho em várias assinaturas e locatários do Azure e não Azure. Ele armazena os dados em uma plataforma de dados comum para serem consumidos por um conjunto comum de ferramentas que podem correlacionar, analisar, visualizar e/ou responder aos dados.

Você precisa de pelo menos um workspace do Log Analytics para habilitar os Logs do Azure Monitor. Você pode usar um único workspace para toda a sua coleta de dados. Você também pode criar vários espaços de trabalho com base nos requisitos para segmentar dados de desempenho. Ele também permite que você defina políticas de retenção.

Coletando dados de desempenho do aplicativo: o Application Insights é um recurso do Azure Monitor que ajuda você a monitorar o desempenho e a disponibilidade do seu aplicativo. Ele fornece insights no nível do aplicativo coletando dados de telemetria, como taxas de solicitação, tempos de resposta e detalhes de exceção. Você pode habilitar o Application Insights para seu aplicativo e configurá-lo para coletar os dados de desempenho necessários. O Application Insights também dá suporte ao rastreamento distribuído. Configure o rastreamento distribuído para todos os fluxos. Para criar fluxos de transação de ponta a ponta, correlacione eventos provenientes de diferentes componentes ou camadas de aplicativos.

Os contadores de desempenho são uma maneira poderosa de monitorar o desempenho do seu aplicativo. O Azure fornece vários contadores de desempenho que você pode usar para coletar dados sobre uso de CPU, uso de memória, E/S de disco, tráfego de rede e muito mais. Se você configurar seu aplicativo para emitir dados do contador de desempenho, o Azure Monitor coletará e armazenará os dados para análise.

Coletando dados de desempenho de recursos: a maioria dos serviços do Azure gera logs e métricas de plataforma que fornecem informações de diagnóstico e auditoria. Ao habilitar as configurações de diagnóstico, você pode especificar os logs e as métricas da plataforma a serem coletados e armazenados. Para fins de correlação, habilite o diagnóstico para todos os serviços com suporte e envie os logs para o mesmo destino que os logs do aplicativo.

Coletando dados de desempenho de banco de dados e armazenamento: o Azure Monitor permite que você colete dados de desempenho para bancos de dados no Azure. Você pode habilitar o monitoramento para Banco de Dados SQL do Azure, Banco de Dados do Azure para MySQL, Banco de Dados do Azure para PostgreSQL e outros serviços de banco de dados. O Azure Monitor fornece métricas e logs para monitorar o desempenho do banco de dados, incluindo uso da CPU, uso de memória e desempenho de consulta. Para ser notificado sobre problemas, você pode configurar alertas com base em limites de desempenho.

O Azure oferece recomendações de desempenho para bancos de dados, como o SQL Server em Máquinas Virtuais do Azure. Essas recomendações ajudam a otimizar o desempenho de suas cargas de trabalho de banco de dados. Eles incluem sugestões para coletar contadores de desempenho, capturar estatísticas de espera e coletar dados de desempenho durante os horários de pico.

A Análise de Armazenamento do Azure permite que você colete dados de desempenho para serviços de Armazenamento do Azure, como Armazenamento de Blobs, Armazenamento de Tabelas e Armazenamento de Filas. Você pode habilitar o log e as métricas para suas contas de armazenamento para monitorar os principais indicadores de desempenho, como o número de operações de leitura/gravação, taxa de transferência e latência.

Coletando dados de desempenho do sistema operacional: a extensão do Diagnóstico do Azure permite que você colete dados detalhados de desempenho de suas VMs (máquinas virtuais), incluindo CPU, memória, E/S de disco e tráfego de rede. Esses dados podem ser enviados para o Azure Monitor ou outros serviços de armazenamento para análise e alertas.

Validando e analisando dados de desempenho: no Azure Monitor, você pode usar os Logs do Azure Monitor para coletar, analisar e visualizar dados de log de seus aplicativos e sistemas. Você pode configurar os Logs do Azure Monitor para ingerir logs do seu aplicativo, incluindo logs no nível do aplicativo e logs de infraestrutura. Ao agregar logs, você pode fazer consultas cruzadas de eventos e obter insights sobre o desempenho do seu aplicativo. Para obter mais informações, consulte Cálculos e opções de custo dos Logs do Azure Monitor e Preços do Azure Monitor.

No Azure Monitor, você pode definir regras de alerta para monitorar métricas de desempenho específicas e disparar alertas com base em condições predefinidas. Por exemplo, você pode criar uma regra de alerta para notificá-lo quando o uso da CPU exceder um determinado limite ou quando o tempo de resposta ultrapassar um limite especificado. Configure a regra de alerta para enviar notificações aos destinatários desejados.

Ao criar uma regra de alerta, você pode definir os critérios que determinam quando um alerta deve ser disparado. Você pode definir limites, métodos de agregação, janelas de tempo e a frequência de avaliação. Defina os critérios com base em seus requisitos de monitoramento de desempenho. Além de enviar notificações, você pode especificar ações a serem executadas quando um alerta é disparado. As ações podem incluir o envio de emails, a chamada de webhooks ou a execução de funções do Azure. Escolha as ações apropriadas para responder ao cenário de alerta específico.

Exemplos

Lista de verificação de eficiência de desempenho

Consulte o conjunto completo de recomendações.