Nós de monitoramento
Uma etapa fundamental no monitoramento e na manutenção da integridade do cluster é identificar qualquer desvio do estado operacional normal ou do desempenho. O Gerenciador de Cluster de HPC permite que você exiba o status do cluster e do nó rapidamente, identifique os nós de problema e faça uma busca detalhada nos detalhes do nó para uma investigação mais detalhada.
Neste tópico:
Correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnóstico
Monitorar o uso e as estatísticas do cluster ao longo do tempo
Exibir o status do cluster rapidamente
Em
Fazer drill down em detalhes individuais do nó
Os modos de exibição de Lista de
executar testes de diagnóstico e relatórios: executar testes de diagnóstico em um ou mais nós de computação.
Exibir Gráficos de Desempenho: exiba um gráfico das métricas de desempenho de um nó de computação ao longo do tempo.
Exibir Eventos do Nó: exibir eventos gerados pelos serviços HPC em um nó de computação específico.
Abra uma conexão de área de trabalho remota com seus nós do HPC Cluster Manager: abra uma sessão de área de trabalho remota para um ou mais nós de computação.
Monitorar operações de nó
O acompanhamento de operações de cluster recentes ou em andamento é outro aspecto de monitoramento que é fundamental para a administração de um cluster. Para obter mais informações, consulte:
Correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnóstico
No HPC Job Manager, você pode usar o Pivot To ações para correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnósticos. Por exemplo, você pode selecionar um ou mais nós no painel de exibições e, em seguida, dinamizar para o Trabalhos para os Nós Selecionados. Isso leva você a uma exibição de lista de trabalhos filtrada pelos nós que você selecionou.
Os caminhos dinâmicos com suporte são:
Nós: pivô para trabalhos, resultados de teste e operações.
trabalhos : pivô para nós.
Resultados do teste: pivô para nós com falha e operações.
Monitorar o uso e as estatísticas do cluster ao longo do tempo
O Gerenciador de Cluster de HPC fornece vários gráficos e relatórios internos para monitorar e analisar o uso de recursos de cluster e as estatísticas de trabalho e nó ao longo do tempo. O banco de dados