O serviço de cluster falha ao iniciar a solução de problemas de diretrizes

Artigo
03/25/2024

Lista de verificação de solução de problemas

Verifique as portas que o serviço de cluster usa

Verifique se as seguintes portas estão abertas ao tráfego de cluster em quaisquer firewalls:

Porta 135: mapeador de ponto de extremidade RPC (chamada de procedimento remoto) ou DCOM (modelo de objeto de componente distribuído).
Porta 135: mapeador de ponto de extremidade RPC sobre o protocolo de datagram do usuário (UDP).
Porta 3343: driver de rede de cluster.
Porta 445: SMB (bloco de mensagens do servidor).
Porta 139: serviço de sessão NetBIOS.
Portas no intervalo de 5000 a 5099: se a ID do evento 1721 for registrada quando você se conectar a um cluster como administrador de cluster, tente abrir as portas nesse intervalo (ou em outras portas) para o tráfego RPC. As portas dão suporte à comunicação por meio do RPC, a menos que você digite apenas um caractere de período (.).

Esse problema pode ocorrer porque o serviço de cluster usa pelo menos 100 portas para comunicação RPC. O número de portas disponíveis para o serviço de cluster pode se tornar muito pequeno quando outros serviços usam algumas das portas necessárias. Esses serviços podem incluir o serviço DNS do Windows, o WINS (serviço de Nome da Internet do Windows) ou o serviço microsoft SQL Server.
Portas no intervalo de 8011 a 8031: se os firewalls separarem os nós de cluster, as portas no intervalo de 8011 a 8031 devem estar abertas para o tráfego interno do RPC. Caso contrário, erros no log de cluster indicam que um nó de patrocinador não está disponível. Esses erros ocorrem porque não há portas suficientes disponíveis para comunicação RPC entre um nó que tenta ingressar no cluster e um nó que pode patrocinar esse nó.

Para obter mais informações sobre como configurar uma rede e portas de rede para um cluster, confira os seguintes artigos:

Depois de alterar as configurações da porta, tente colocar o nó online novamente antes de prosseguir.

Executar a ferramenta de validação de cluster

Abra o snap-in do Gerenciador de Cluster de Failover (CluAdmin.msc).
Selecione Gerenciador de Cluster de Failover na coluna superior esquerda.
Selecione Validar Configuração.
Digite o nome de cada nó no cluster e selecione Adicionar após cada um deles.
Quando todos os nós tiverem sido adicionados aos servidores selecionados: lista, selecione Avançar.
Selecione Executar todos os testes (recomendado)>Próximo>Próximo.
Permitir que o teste seja concluído. Depois de concluído, selecione Exibir Relatório.
Examine todos os resultados de testes rotulados como Falha ou Aviso. Essas informações podem ajudar a fornecer etapas acionáveis para corrigir o problema.
Para obter um arquivo para download, navegue até a pasta C:\Windows\Cluster\Reports e abra o Relatório de Validação (. Arquivo MHT).

Observação

Em versões Windows Server 2016 e posteriores, é um arquivo .HTM.

Verifique as políticas de segurança que podem afetar o nó de cluster

No objeto Política de Grupo Editor, esses objetos de política estão localizados em Configuração do Computador\Configurações do Windows\Configurações de Segurança\Políticas Locais\Atribuição de Direitos do Usuário.

Observação

Para acessar as configurações da política de segurança local, selecione Iniciar, digite política de segurança local e selecione Política de Segurança Local.

Verifique se a lista de contas inclui as contas responsáveis pela execução do nó de cluster. Para obter mais informações, consulte Como acessar esse computador na rede e Permitir logon na configuração de política de segurança local.
Verifique se a lista de contas não inclui contas locais. Para obter mais informações, consulte Como negar acesso a esse computador por meio da rede.
Verifique se a lista de contas e grupos não inclui o grupo "Todos". Para obter mais informações, consulte Negar log na configuração de política de segurança local.

Depois de alterar as configurações da política, tente colocar o nó online novamente antes de prosseguir.

Desabilitar temporariamente firewalls

Desabilite o firewall entre o nó e o restante do cluster e tente colocar o nó online novamente. Se o nó ainda não estiver online, o firewall poderá ser a causa.

Importante

Não deixe essa alteração no lugar depois de concluir a solução de problemas. Depois de usar essa alteração para teste, retorne essas configurações à configuração original.

Verifique se há problemas de hardware e software de rede

Verifique o log de eventos do sistema em busca de erros de hardware ou software relacionados aos adaptadores de rede neste nó.
Verifique o adaptador de rede, os cabos e a configuração de rede para as redes que conectam os nós.
Se você estiver unindo os adaptadores de rede, verifique se a configuração de equipe está correta.
Verifique hubs, comutadores ou pontes nas redes que conectam os nós.

Examinar arquivos de log

Para identificar a origem do problema, examine as informações de log de várias fontes. Por exemplo:

Em Visualizador de Eventos, navegue até Logs de Aplicativos e Serviços\Microsoft\Windows\FailoverClustering-Client\Diagnostic e examine os logs de Rastreamento de Depuração da API de Cluster.
Gere um log de cluster novo para o nó. No servidor que está executando o nó afetado, abra um prompt do PowerShell elevado e execute o seguinte cmdlet:

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Para gerar um rastreamento mais detalhado, siga estas etapas:

Em um prompt do PowerShell elevado, execute o seguinte cmdlet para iniciar o rastreamento:

logman create trace "base_cluster" -ow -o c:\base_cluster.etl -p "Microsoft-Windows-FailoverClustering-Client" 0xffffffffffffffff 0xff -nb 16 16 -bs 1024 -mode Circular -f bincirc -max 4096 -ets
Reproduza o problema.
Para interromper o rastreamento, execute o seguinte cmdlet:

Logman stop base_cluster.etl -ets
Para converter o rastreamento, execute o seguinte cmdlet:

Netsh trace convert base_cluster.etl
Para gerar um log de cluster a partir dos dados, execute o seguinte cmdlet:

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Para obter mais informações sobre rastreamento e outros problemas a serem olhados, confira Como solucionar problemas para criar falhas de cluster.

Compartilhar via