VM Watch é uma oferta de serviço padronizada, leve e adaptável para máquinas virtuais (VMs) e sets de dimensionamento de máquinas virtuais. Ele executa verificações de integridade em uma VM em intervalos configuráveis e envia os resultados por meio de um modelo de dados uniforme para o Azure. Os mecanismos de operações de IA (AIOps) para monitoramento de produção no Azure consomem esses resultados de integridade para deteção e prevenção de regressão.
O monitoramento de VM é fornecido por meio da extensão Application Health VM para fornecer facilidade de implantação e capacidade de gerenciamento para os clientes. Além disso, o relógio VM é oferecido sem custo extra.
Especificidades de monitorização para vigilância de VM
-
Facilidade de adoção: a monitorização de VM está disponível através da extensão de saúde do aplicativo para VM.
-
Implantação flexível: você pode habilitar a observação de VM usando um modelo do Azure Resource Manager (modelo ARM), PowerShell ou a CLI do Azure.
-
Compatibilidade: O relógio VM opera perfeitamente em ambientes Linux e Windows. É adequado tanto para VMs individuais quanto para conjuntos de escalonamento de máquinas virtuais.
-
Governança de recursos: a observação VM fornece monitoramento eficiente sem afetar o desempenho do sistema. Os limites de recursos na utilização da CPU e da memória do processo de monitorização da VM ajudam a proteger as VMs.
-
Prontidão pronta para uso: o relógio VM vem equipado com um conjunto de testes padrão que você pode configurar para seus cenários.
Restrições de memória do relógio VM
Para manter um desempenho consistente em diferentes configurações de máquina virtual (VM), o monitoramento de VM impõe limites de uso de memória de acordo com a memória total disponível da SKU da VM. Os limites de memória são ajustados dinamicamente com base na camada de memória da VM.
Intervalo de memória VM |
Limite de memória do monitor VM |
Menos de 8 GB |
80MB |
8 GB a 16 GB |
200MB |
Maior que 16 GB |
400MB |
Rede
Nome do sinal |
Tipo |
Descrição |
Conectividade Externa |
Marcar |
Verifique a conectividade de saída de rede da VM do Azure. |
Resolução DNS |
Marcar |
Verifique se um ou mais nomes DNS podem ser resolvidos. |
TCPSynRetransmits (somente Linux) |
Métrica |
O número de vezes que o sistema retransmite um pacote TCP SYN e SYN/ACK antes de desistir de estabelecer uma conexão. |
SegmentosRetransmitidos |
Métrica |
O número de segmentos TCP transmitidos que contêm um ou mais octetos transmitidos anteriormente. |
Segmentos Normalizados Retransmitidos |
Métrica |
SegmentosRetransmitidos / (SegmentosEnviados + SegmentosRetransmitidos) |
Redefinições de conexão |
Métrica |
O número de vezes que as ligações TCP fizeram uma transição direta para o estado CLOSED a partir do estado ESTABLISHED ou do estado CLOSE_WAIT . |
Reinicializações de Conexão Normalizadas |
Métrica |
A porcentagem de conexões que foram redefinidas durante o último intervalo de medição. |
TentativasDeConexãoFracassadas |
Métrica |
O número de vezes que as ligações TCP fizeram uma transição direta para o estado CLOSED a partir do estado SYN_SENT ou do estado SYN_RCVD . |
TentativasDeConexãoFalhadasNormalizadas |
Métrica |
TentativasFalhadasDeConexão / (AberturasAtivasDeConexão + AberturasPassivasDeConexão) |
Aberturas de Conexão Ativas |
Métrica |
O número de vezes que as conexões TCP fizeram uma transição direta para o estado SYN_SENT a partir do estado CLOSED . |
Aberturas de Conexões Passivas |
Métrica |
O número de vezes que as conexões TCP fizeram uma transição direta para o estado SYN_RCVD a partir do estado LISTEN . |
CurrentConnections |
Métrica |
O número de conexões estabelecidas. |
SegmentosRecebidos |
Métrica |
O número de segmentos recebidos, incluindo segmentos recebidos por engano. |
Segmentos Enviados |
Métrica |
O número de segmentos enviados, incluindo segmentos em ligações atuais, mas excluindo segmentos que contêm apenas octetos retransmitidos. |
Disco
Nome do sinal |
Tipo |
Descrição |
E/S de Disco do Azure |
Marcar |
Verifique a criação, gravação e leitura de arquivos. Eliminar operações em cada disco montado na VM. |
FreeSpaceInBytes |
Métrica |
O espaço livre em disco do ponto de montagem de destino. |
UsedSpaceInBytes |
Métrica |
O espaço em disco usado do ponto de montagem de destino. |
CapacityInBytes |
Métrica |
A capacidade de espaço em disco do ponto de montagem de destino. |
Percentagem Usada |
Métrica |
A porcentagem de espaço em disco usado para o ponto de montagem de destino. |
WriteOps |
Métrica |
As operações de gravação no disco/partição de destino por segundo. |
ReadOps |
Métrica |
As operações de leitura por segundo para o disco/partição de destino. |
Unidade Central de Processamento (CPU)
Nome do sinal |
Tipo |
Descrição |
ProcessCPUCoreUsage |
Métrica |
Uma medição instantânea da porcentagem de um único núcleo de CPU que o processo de destino está usando (100 = 100%, um núcleo inteiro). |
ProcessCPUMachineUsage |
Métrica |
A porcentagem da CPU total da máquina que esse processo está usando. |
MachineTotalCpuUsage |
Métrica |
A utilização instantânea total da CPU da VM. |
Memória
Nome do sinal |
Tipo |
Descrição |
ProcessRSSPercent |
Métrica |
Processo RSS / (Memória total * da máquina100%) |
ProcessPageFaults |
Métrica |
O número de falhas de página desde o início do processo. |
MachineMemoryTotalInBytes |
Métrica |
A memória total da VM em bytes. |
MachineMemoryUsedPercent |
Métrica |
Memória Usada da Máquina / (Memória * Total da Máquina100%) |
TotalPageFaults |
Métrica |
O número total de falhas de página para todos os processos em execução desde que foram iniciados. |
Processo
Nome do sinal |
Tipo |
Descrição |
Criação de Processos |
Marcar |
Inicie um processo leve para validar que a criação do processo é possível. |
Processo(s) em execução |
Marcar |
Verifique se o(s) processo(s) de destino está(ão) em execução. |
Tempo de atividade |
Métrica |
Há quanto tempo o processo alvo está em execução desde a última inicialização do processo. |
IMDS
Nome do sinal |
Tipo |
Descrição |
IMDS |
Marcar |
Verifique se o usuário pode acessar um ponto de extremidade do IMDS (Serviço de Metadados de Instância do Azure) de dentro da VM. As informações da VM são obtidas a partir da consulta ao endpoint IMDS. |
Relógio
Nome do sinal |
Tipo |
Descrição |
Distorção do relógio |
Marcar |
Verifique a distorção do relógio entre o servidor NTP (Network Time Protocol) remoto e a VM do Azure. Para uma VM do Windows, volte para verificar se o serviço de Tempo do Windows está sincronizado com w32tm se o servidor NTP remoto estiver inacessível. |
SO
Nome do sinal |
Tipo |
Descrição |
Erros do sistema |
Métrica |
Colete o número de erros do registo de eventos a nível do sistema (apenas para Windows) onde SystemData <=2 (incluindo LOG_ALWAYS, Crítico, Erro). O alvo de medição é definido como o Source_EventId do EventLog utilizando a configuração regional padrão do Windows. Cada recolha está limitada a mais de 10 metas de medição diferentes. |
Azblob
Nome do sinal |
Tipo |
Descrição |
Conectividade de Bolhas de Armazenamento do Azure |
Marcar |
Verifique a conectividade com o blob de Armazenamento do Azure e baixe o blob usando MSI ou um token de assinatura de acesso compartilhado (SAS). |
Equipamento
Nome do sinal |
Tipo |
Descrição |
Monitor de Estado de Funcionamento do Hardware |
Registo de Eventos |
Recolha informações sobre a integridade do hardware do registo de eventos do Windows. Atualmente, apenas eventos críticos relacionados ao disco são coletados, incluindo eventos com ID 7, 500, 504, 505, 512 e 549. |
Saúde do hardware Nvidia Smi |
Registo de Eventos |
Colete estatísticas da GPU, incluindo memória e uso da GPU, temp e outros, executando o comando nvidia-smi (somente Linux Ubuntu) |
Conteúdos relacionados