Condividi tramite


Il servizio cluster smette di rispondere in un nodo del cluster quando si riavvia il nodo attivo

Questo articolo fornisce una risoluzione del problema che il servizio cluster smette di rispondere in un nodo del cluster quando si riavvia il nodo attivo.

Numero KB originale: 822050

Sintomi

Quando si riavvia il nodo attivo di un cluster di server costituito da due o più nodi, si verificano tutti i sintomi seguenti:

  • Se si esegue l'amministratore del cluster nei nodi rimanenti, viene visualizzato il messaggio di errore seguente quando si tenta di connettersi al cluster:

    Il cluster 'ClusterName' non è più disponibile.

  • Se si tenta di avviare l'amministratore del cluster, l'amministratore del cluster smette di rispondere e potrebbe essere visualizzato il messaggio di errore seguente:

    Si è verificato un errore durante il tentativo di aprire il cluster in 'ServerName':

    L'interfaccia è sconosciuta.

    ID errore: 1717 (000006b5).

  • Quando si visualizza il contenuto di C:\Winnt\ Cluster.log, le informazioni sono simili alle seguenti:

    [FM] OnlineGroup: non riuscito nella risorsa e3f4af72-6454-4199-b9af-fa6f57032a65. Stato 70
    Il servizio Microsoft Clustering ha subito un errore irreversibile imprevisto
    alla riga 701 del modulo di origine D:\nt\private\cluster\service\fm\group.c. Il codice di errore è 70.

  • Quando il nodo del cluster riavviato viene avviato correttamente, il programma Amministratore cluster in esecuzione negli altri nodi risponde come previsto.

Causa

Questo problema si verifica se si sospende un nodo di un cluster server e quindi si riavvia il nodo del cluster attivo. Quando il nodo attivo viene riavviato, il nodo sospeso tenta di portare online i gruppi di risorse. Poiché questo nodo è in pausa, non può effettuare ulteriori connessioni e non può portare online il gruppo di dischi quorum. Il codice di errore 70 corrisponde al messaggio di errore seguente:

Il server remoto è stato sospeso o è in corso di avvio.

Note

Questi risultati si verificheranno anche nei cluster con più di due nodi. Anche se un nodo non sospeso esiste in uno stato di lavoro quando il nodo attivo viene riavviato, se il nodo sospeso è il primo nodo contattato per acquisire la proprietà del disco quorum. Il nodo non sospeso non ha la possibilità di eseguire ilbitrate per il disco quorum.

Risoluzione

Per risolvere questo problema, riprendere il nodo del cluster sospeso prima di riavviare il nodo del cluster attivo.

Note

Prima di riprendere un nodo del cluster sospeso, è necessario determinare se un nodo del cluster è sospeso.

  1. Fare clic su Start, fare clic su Esegui, digitare cmd nella casella Apri e quindi fare clic su OK.

  2. Al prompt dei comandi digitare il nodo del cluster e quindi premere INVIO. L'output è simile a:

    Note

    L'output di esempio seguente si basa su una configurazione cluster a due nodi. Se sono presenti più di due nodi, nell'elenco verranno visualizzati anche i nodi aggiuntivi.

    Stato ID nodo nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 sospeso
    CLUSTER-2 2 Up

    Note

    Se l'unico nodo del cluster non sospeso è in corso di riavvio, viene visualizzato il messaggio di errore seguente:
    Errore di sistema 1753. Non sono presenti altri endpoint disponibili dal mapper di endpoint.

  3. Al prompt dei comandi digitare nodo cluster node_name /resume (dove node_name è il nome del nodo del cluster) e quindi premere INVIO.

    Ad esempio, digitare cluster node cluster-1 /resume e quindi premere INVIO. Le informazioni sono simili a:

    Ripresa del nodo 'cluster-1'...

    Stato ID nodo nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 Up