Partilhar via


Nós de monitoramento

Uma etapa fundamental no monitoramento e na manutenção da integridade do cluster é identificar qualquer desvio do estado operacional normal ou do desempenho. O Gerenciador de Cluster de HPC permite que você exiba o status do cluster e do nó rapidamente, identifique os nós de problema e faça uma busca detalhada nos detalhes do nó para uma investigação mais detalhada.

Neste tópico:

Exibir o status do cluster rapidamente

Em o Gerenciamento de Nós você pode monitorar seu cluster rapidamente usando o modo de exibição lista de de nó ou o nó exibição de mapa de calor. Em gráficos ede relatório, os gráficos de monitoramento exibem dados atuais e recentes sobre a integridade do nó e a utilização do cluster. Para obter mais informações, consulte:

Fazer drill down em detalhes individuais do nó

Os modos de exibição de Lista de e mapa de calor fornecem um ponto de partida para identificar áreas problemáticas. Clique duas vezes em um nó de computação para ver informações detalhadas, como hardware, propriedades do sistema operacional e métricas de desempenho atuais. Você também pode selecionar um ou mais nós e, em seguida, fazer uma busca detalhada nos detalhes do nó para investigar o desempenho.

Monitorar operações de nó

O acompanhamento de operações de cluster recentes ou em andamento é outro aspecto de monitoramento que é fundamental para a administração de um cluster. Para obter mais informações, consulte:

Correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnóstico

No HPC Job Manager, você pode usar o Pivot To ações para correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnósticos. Por exemplo, você pode selecionar um ou mais nós no painel de exibições e, em seguida, dinamizar para o Trabalhos para os Nós Selecionados. Isso leva você a uma exibição de lista de trabalhos filtrada pelos nós que você selecionou.

Os caminhos dinâmicos com suporte são:

  • Nós: pivô para trabalhos, resultados de teste e operações.

  • trabalhos : pivô para nós.

  • Resultados do teste: pivô para nós com falha e operações.

Monitorar o uso e as estatísticas do cluster ao longo do tempo

O Gerenciador de Cluster de HPC fornece vários gráficos e relatórios internos para monitorar e analisar o uso de recursos de cluster e as estatísticas de trabalho e nó ao longo do tempo. O banco de dados HPCReporting também dá suporte a relatórios personalizados. Para obter mais informações, consulte Gráficos e Relatórios: HPC Cluster Manager.

Nesta seção