Condividi tramite


Clustering di failover in Windows Server e Azure Locale

Il clustering di failover è una strategia efficace per garantire disponibilità elevata e operazioni ininterrotte in ambienti critici. Implica una configurazione di computer indipendenti, noti come nodi, che interagiscono per migliorare la disponibilità e la scalabilità di applicazioni e servizi, ora definiti ruoli in cluster. Questi nodi sono interconnessi tramite cablaggio fisico e software.

Se si verifica un errore in uno o più nodi, i nodi rimanenti assumono automaticamente il carico di lavoro, un processo denominato failover, riducendo al minimo le interruzioni. Inoltre, l'integrità dei ruoli in cluster viene monitorata continuamente. Se vengono rilevati problemi, i ruoli vengono riavviati o migrati in un altro nodo per mantenere il funzionamento senza problemi. Questo approccio proattivo garantisce che i servizi rimangano costantemente disponibili, anche se si verificano errori hardware o software.

La rete è un ruolo fondamentale nei cluster di failover abilitando la comunicazione affidabile e lo scambio efficiente di dati tra i nodi del cluster e con i client esterni. I cluster spesso usano reti private dedicate per funzioni interne, come i segnali di battito cardiaco e la gestione del cluster, mentre reti pubbliche separate gestiscono l'accesso dei clienti e i dati dell'applicazione. Questa separazione di rete migliora le prestazioni e la sicurezza isolando il traffico critico del cluster da interruzioni esterne. Aumenta anche la tolleranza di errore, assicurandosi che le operazioni interne del cluster rimangano ininterrotte e che le connessioni client mantengano la disponibilità elevata durante gli eventi di failover.

L'integrità del cluster viene monitorata continuamente tramite segnali heartbeat, che consentono di rilevare eventuali problemi. Se si verifica un problema, il sistema può avviare automaticamente un failover per mantenere la continuità del servizio. Per proteggere i dati sensibili e soddisfare gli standard dell'organizzazione, i cluster di failover incorporano misure di sicurezza affidabili, ad esempio la crittografia per proteggere i dati in transito e inattivi. Usano anche un controllo di accesso granulare per gestire in modo efficace le autorizzazioni e i diritti di accesso.

Per ulteriori informazioni sul clustering di failover in Azure Local, consultare Comprendere il quorum del cluster e del pool.

Configurazione del failover attivo e passivo

I cluster di failover possono essere configurati in due modalità principali, attivo-attivo e attivo-passivo. Ogni configurazione comporta i propri compromessi, con l'attivo-attivo che si concentra su prestazioni ed efficienza delle risorse, mentre l'attivo-passivo enfatizza semplicità e affidabilità negli scenari di failover. La scelta dipende da esigenze organizzative specifiche e dalla criticità delle applicazioni in cluster.

Configurazione Operazione
Attivo In un cluster di failover attivo-attivo, tutti i nodi sono attivi e collaborano contemporaneamente per bilanciare il carico di lavoro all'interno del cluster. Questa configurazione distribuisce attività, potenza di elaborazione o servizi tra tutti i nodi disponibili, rendendo efficiente l'uso delle risorse. Ecco come funziona:

  • Bilanciamento del carico: Ogni nodo gestisce una parte del carico di lavoro totale, migliorando le prestazioni e assicurando che nessun singolo nodo diventi un collo di bottiglia. Questa distribuzione uguale può migliorare la velocità di risposta e la velocità effettiva, perché più nodi servono le richieste contemporaneamente.
  • Utilizzo delle risorse: Una configurazione attiva-attiva ottimizza l'utilizzo delle risorse perché tutti i nodi sono operativi e contribuiscono alle prestazioni del cluster. Questa configurazione è ideale per gli ambienti in cui la ottimizzazione delle risorse disponibili è fondamentale.
  • Tolleranza ai guasti: Se un nodo ha esito negativo, i nodi rimanenti nel cluster possono continuare a gestire il carico di lavoro. La perdita di un nodo potrebbe ridurre temporaneamente la capacità complessiva, ma il sistema rimane operativo senza interruzioni del servizio.
  • Passivo In un cluster di failover attivo-passivo alcuni nodi vengono designati come attivi mentre altri sono in standby, pronti per assumere il controllo in caso di errore di un nodo attivo. Ecco come funziona:

  • Nodi di standby: I nodi passivi sono essenzialmente in uno stato di "attesa", non gestiscono attività o servizi durante le normali operazioni. Questi nodi sono in primo grado di assumere le responsabilità in caso di errore di un nodo attivo.
  • Processo di failover: Quando viene rilevato un errore, viene attivato un nodo standby per assumere le responsabilità del nodo non riuscito. Ciò comporta un rapido trasferimento online del nodo passivo per garantire la continuità dei servizi.
  • Allocazione delle risorse: Le configurazioni attive-passive potrebbero non usare completamente le risorse hardware disponibili durante le normali operazioni perché i nodi di standby rimangono inattive. Tuttavia, questa configurazione può essere più semplice da gestire e potrebbe garantire prestazioni prevedibili in determinate condizioni.
  • Semplicità e affidabilità: Una configurazione attiva-passiva può essere vantaggiosa per le applicazioni in cui la stabilità e la prevedibilità sono più importanti rispetto alla massimizzazione dell'efficienza operativa. Spesso è più semplice implementare e gestire rispetto a una configurazione attiva-attiva.
  • Funzionalità del clustering di failover

    Il clustering di failover offre un set completo di funzionalità progettate per massimizzare il tempo di attività, assicurare l'integrità dei dati e semplificare la gestione dei carichi di lavoro critici. Queste funzionalità consentono alle organizzazioni di mantenere la continuità del servizio, gestire in modo efficiente le risorse e ripristinare rapidamente da errori hardware o software. Alcune funzionalità offerte dal clustering di failover includono:

    • Nodi del cluster e quorum:

      I nodi del cluster collaborano per gestire ciò che è noto come quorum, che è essenzialmente il numero minimo di voti dei membri del cluster necessari per il corretto funzionamento del cluster. Questo meccanismo impedisce scenari split-brain, in cui parti suddivise di un cluster potrebbero tentare di operare in modo indipendente, causando potenzialmente incoerenze. I modelli quorum, ad esempio maggioranza dei nodi, maggioranza dei nodi e disco, maggioranza dei nodi e condivisione file e nessuna maggioranza (solo disco), determinano la modalità di assegnazione e conteggio dei voti. Ad esempio, la maggioranza dei nodi assegna a ogni nodo un voto, mentre Node e Disk Majority incorporano voti aggiuntivi da un disco o da una condivisione file.

    • Configurazione dell'archiviazione:

      Una funzionalità notevole dei cluster di failover è il volume condiviso cluster (CSV), che consente a più nodi di accedere contemporaneamente alla stessa risorsa di archiviazione, consentendo una gestione e un coordinamento uniformi del disco senza perdita di prestazioni. Volumi Condivisi Cluster (CSVs) sono parte integrante delle configurazioni di archiviazione nei cluster di failover. I volumi condivisi cluster facilitano l'accesso efficiente ai dischi, consentendo ai nodi di gestire congiuntamente le attività di archiviazione.

    • Monitoraggio e gestione proattivi:

      I cluster di failover usano i segnali di battito cardiaco come mezzo per monitorare la salute dei nodi e i loro ruoli. Questi segnali consentono di rilevare problemi quali errori del nodo o interruzioni del servizio. Quando vengono rilevati questi problemi, il sistema può avviare automaticamente le procedure di failover, garantendo la continuità e riducendo al minimo i tempi di inattività.

    • Sicurezza e conformità:

      La sicurezza è un aspetto essenziale dei cluster di failover, incorporando funzionalità come la crittografia e il controllo di accesso per proteggere i dati e le operazioni del cluster. I cluster consentono alle organizzazioni di soddisfare i requisiti di conformità per le applicazioni critiche garantendo la gestione sicura dei dati e le prestazioni affidabili del sistema. Ciò li rende adatti per ambienti che richiedono una rigorosa protezione dei dati e conformità alle normative.

    • Casi d'uso:

      Il clustering di failover ha diverse applicazioni pratiche, tra cui il ripristino di emergenza, il bilanciamento del carico e l'elaborazione ad alte prestazioni. Supporta applicazioni critiche fornendo disponibilità elevata, consentendo alle aziende di mantenere le operazioni anche in condizioni avverse. Negli scenari di ripristino di emergenza, ad esempio, i cluster possono ripristinare rapidamente i servizi trasferendo le operazioni a nodi non interessati.

      • Il clustering di failover garantisce disponibilità elevata o disponibilità continua per applicazioni e servizi critici (ruoli in cluster) in esecuzione su server fisici o macchine virtuali. Se si verifica un errore, questi ruoli possono essere spostati o riavviati rapidamente in un altro nodo, riducendo al minimo i tempi di inattività e mantenendo prestazioni e ridondanza coerenti.

      • Le applicazioni come Microsoft SQL Server e le macchine virtuali Hyper-V traggono vantaggio dal clustering di failover poiché riscontrano interruzioni minime del servizio, anche durante guasti hardware o software.

    Risorse di clustering di failover

    Questa tabella di risorse selezionate è progettata per aiutarti a comprendere, pianificare, distribuire e gestire efficacemente il failover clustering.

    Comprensione Pianificazione Distribuzione
    Novità nel cluster di failover Pianificazione dei requisiti hardware per il clustering di failover e delle opzioni di archiviazione Creazione di un cluster di failover
    File Server di Scalabilità Orizzontale per i Dati delle Applicazioni Usare Volumi Condivisi del Cluster Distribuire un file server a due nodi
    Quorum di cluster e pool Utilizzo dei cluster di macchine virtuali guest con Spazi di Archiviazione Diretta Preconfigurare oggetti computer del cluster in Active Directory Domain Services
    Riconoscimento dei domini di errore Configurazione degli account di cluster in Active Directory
    Reti di cluster SMB Multicanale semplificato e Multi-NIC Ripristinare un cluster di failover senza quorum
    Bilanciamento del carico delle macchine virtuali Distribuire un testimone di quorum
    Set di cluster Aggiornamenti in sequenza del sistema operativo del cluster
    Affinità del cluster Aggiornamento di un cluster di failover nello stesso hardware
    Distribuire un cluster scollegato da Active Directory
    Gestire Strumenti e impostazioni Risorse della community
    Aggiornamento ottimizzato per i cluster Cmdlet di PowerShell per il Failover Clustering Failover Cluster Forum
    Servizio Sanitario Cmdlet di PowerShell per l'Aggiornamento consapevole del cluster Failover Clustering Blog
    Migrazione del dominio del cluster
    Risoluzione dei problemi con Segnalazione errori Windows