Partilhar via


VM Watch: Melhoria da monitorização do estado da VM (pré-visualização)

VM Watch é uma oferta de serviço padronizada, leve e adaptável para máquinas virtuais (VMs) e sets de dimensionamento de máquinas virtuais. Ele executa verificações de integridade em uma VM em intervalos configuráveis e envia os resultados por meio de um modelo de dados uniforme para o Azure. Os mecanismos de operações de IA (AIOps) para monitoramento de produção no Azure consomem esses resultados de integridade para deteção e prevenção de regressão.

O monitoramento de VM é fornecido por meio da extensão Application Health VM para fornecer facilidade de implantação e capacidade de gerenciamento para os clientes. Além disso, o relógio VM é oferecido sem custo extra.

Especificidades de monitorização para vigilância de VM

  • Facilidade de adoção: a monitorização de VM está disponível através da extensão de saúde do aplicativo para VM.
  • Implantação flexível: você pode habilitar a observação de VM usando um modelo do Azure Resource Manager (modelo ARM), PowerShell ou a CLI do Azure.
  • Compatibilidade: O relógio VM opera perfeitamente em ambientes Linux e Windows. É adequado tanto para VMs individuais quanto para conjuntos de escalonamento de máquinas virtuais.
  • Governança de recursos: a observação VM fornece monitoramento eficiente sem afetar o desempenho do sistema. Os limites de recursos na utilização da CPU e da memória do processo de monitorização da VM ajudam a proteger as VMs.
  • Prontidão pronta para uso: o relógio VM vem equipado com um conjunto de testes padrão que você pode configurar para seus cenários.

Restrições de memória do relógio VM

Para manter um desempenho consistente em diferentes configurações de máquina virtual (VM), o monitoramento de VM impõe limites de uso de memória de acordo com a memória total disponível da SKU da VM. Os limites de memória são ajustados dinamicamente com base na camada de memória da VM.

Intervalo de memória VM Limite de memória do monitor VM
Menos de 8 GB 80MB
8 GB a 16 GB 200MB
Maior que 16 GB 400MB

Rede

Nome do sinal Tipo Descrição
Conectividade Externa Marcar Verifique a conectividade de saída de rede da VM do Azure.
Resolução DNS Marcar Verifique se um ou mais nomes DNS podem ser resolvidos.
TCPSynRetransmits (somente Linux) Métrica O número de vezes que o sistema retransmite um pacote TCP SYN e SYN/ACK antes de desistir de estabelecer uma conexão.
SegmentosRetransmitidos Métrica O número de segmentos TCP transmitidos que contêm um ou mais octetos transmitidos anteriormente.
Segmentos Normalizados Retransmitidos Métrica SegmentosRetransmitidos / (SegmentosEnviados + SegmentosRetransmitidos)
Redefinições de conexão Métrica O número de vezes que as ligações TCP fizeram uma transição direta para o estado CLOSED a partir do estado ESTABLISHED ou do estado CLOSE_WAIT.
Reinicializações de Conexão Normalizadas Métrica A porcentagem de conexões que foram redefinidas durante o último intervalo de medição.
TentativasDeConexãoFracassadas Métrica O número de vezes que as ligações TCP fizeram uma transição direta para o estado CLOSED a partir do estado SYN_SENT ou do estado SYN_RCVD.
TentativasDeConexãoFalhadasNormalizadas Métrica TentativasFalhadasDeConexão / (AberturasAtivasDeConexão + AberturasPassivasDeConexão)
Aberturas de Conexão Ativas Métrica O número de vezes que as conexões TCP fizeram uma transição direta para o estado SYN_SENT a partir do estado CLOSED.
Aberturas de Conexões Passivas Métrica O número de vezes que as conexões TCP fizeram uma transição direta para o estado SYN_RCVD a partir do estado LISTEN.
CurrentConnections Métrica O número de conexões estabelecidas.
SegmentosRecebidos Métrica O número de segmentos recebidos, incluindo segmentos recebidos por engano.
Segmentos Enviados Métrica O número de segmentos enviados, incluindo segmentos em ligações atuais, mas excluindo segmentos que contêm apenas octetos retransmitidos.

Disco

Nome do sinal Tipo Descrição
E/S de Disco do Azure Marcar Verifique a criação, gravação e leitura de arquivos. Eliminar operações em cada disco montado na VM.
FreeSpaceInBytes Métrica O espaço livre em disco do ponto de montagem de destino.
UsedSpaceInBytes Métrica O espaço em disco usado do ponto de montagem de destino.
CapacityInBytes Métrica A capacidade de espaço em disco do ponto de montagem de destino.
Percentagem Usada Métrica A porcentagem de espaço em disco usado para o ponto de montagem de destino.
WriteOps Métrica As operações de gravação no disco/partição de destino por segundo.
ReadOps Métrica As operações de leitura por segundo para o disco/partição de destino.

Unidade Central de Processamento (CPU)

Nome do sinal Tipo Descrição
ProcessCPUCoreUsage Métrica Uma medição instantânea da porcentagem de um único núcleo de CPU que o processo de destino está usando (100 = 100%, um núcleo inteiro).
ProcessCPUMachineUsage Métrica A porcentagem da CPU total da máquina que esse processo está usando.
MachineTotalCpuUsage Métrica A utilização instantânea total da CPU da VM.

Memória

Nome do sinal Tipo Descrição
ProcessRSSPercent Métrica Processo RSS / (Memória total * da máquina100%)
ProcessPageFaults Métrica O número de falhas de página desde o início do processo.
MachineMemoryTotalInBytes Métrica A memória total da VM em bytes.
MachineMemoryUsedPercent Métrica Memória Usada da Máquina / (Memória * Total da Máquina100%)
TotalPageFaults Métrica O número total de falhas de página para todos os processos em execução desde que foram iniciados.

Processo

Nome do sinal Tipo Descrição
Criação de Processos Marcar Inicie um processo leve para validar que a criação do processo é possível.
Processo(s) em execução Marcar Verifique se o(s) processo(s) de destino está(ão) em execução.
Tempo de atividade Métrica Há quanto tempo o processo alvo está em execução desde a última inicialização do processo.

IMDS

Nome do sinal Tipo Descrição
IMDS Marcar Verifique se o usuário pode acessar um ponto de extremidade do IMDS (Serviço de Metadados de Instância do Azure) de dentro da VM. As informações da VM são obtidas a partir da consulta ao endpoint IMDS.

Relógio

Nome do sinal Tipo Descrição
Distorção do relógio Marcar Verifique a distorção do relógio entre o servidor NTP (Network Time Protocol) remoto e a VM do Azure. Para uma VM do Windows, volte para verificar se o serviço de Tempo do Windows está sincronizado com w32tm se o servidor NTP remoto estiver inacessível.

SO

Nome do sinal Tipo Descrição
Erros do sistema Métrica Colete o número de erros do registo de eventos a nível do sistema (apenas para Windows) onde SystemData <=2 (incluindo LOG_ALWAYS, Crítico, Erro). O alvo de medição é definido como o Source_EventId do EventLog utilizando a configuração regional padrão do Windows. Cada recolha está limitada a mais de 10 metas de medição diferentes.

Azblob

Nome do sinal Tipo Descrição
Conectividade de Bolhas de Armazenamento do Azure Marcar Verifique a conectividade com o blob de Armazenamento do Azure e baixe o blob usando MSI ou um token de assinatura de acesso compartilhado (SAS).

Equipamento

Nome do sinal Tipo Descrição
Monitor de Estado de Funcionamento do Hardware Registo de Eventos Recolha informações sobre a integridade do hardware do registo de eventos do Windows. Atualmente, apenas eventos críticos relacionados ao disco são coletados, incluindo eventos com ID 7, 500, 504, 505, 512 e 549.
Saúde do hardware Nvidia Smi Registo de Eventos Colete estatísticas da GPU, incluindo memória e uso da GPU, temp e outros, executando o comando nvidia-smi (somente Linux Ubuntu)