Usare i cluster estesi di Azure Stack HCI per il ripristino di emergenza

Azure Stack HCI
Archiviazione BLOB di Azure
Backup di Azure
Monitoraggio di Azure

L'architettura di riferimento seguente illustra come progettare e implementare il ripristino di emergenza di Azure Stack HCI usando il clustering esteso.

Architettura

Diagramma che illustra un cluster esteso attivo-attivo e attivo-passivo di Azure Stack HCI, con volumi di archiviazione e cronologia delle prestazioni del cluster replicati tramite Replica di archiviazione. Nella modalità attiva-attiva è presente il traffico di replica in ogni direzione, con entrambi i siti che ospitano macchine virtuali di Azure Stack HCI. Nella modalità attiva-passiva, la replica è unidirezionale, con il sito attivo che ospita le macchine virtuali di Azure Stack HCI.

Scaricare un file di Visio di questa architettura.

Componenti

L'architettura incorpora i componenti e le funzionalità seguenti:

  • Azure Stack HCI (22H2). Azure Stack HCI è una soluzione cluster HCI (Hyperconverged Infrastructure) che è possibile usare per ospitare carichi di lavoro Windows e Linux virtualizzati e le relative risorse di archiviazione in un ambiente locale ibrido. È possibile configurare il cluster esteso con 4-16 nodi fisici.
  • Replica archiviazione. Replica archiviazione è una tecnologia Windows Server che consente la replica del volume tra server o cluster allo scopo del ripristino di emergenza.
  • Migrazione in tempo reale. La migrazione in tempo reale è una funzionalità Hyper-V in Windows Server che consente di spostare facilmente le macchine virtuali in esecuzione da un host Hyper-V a un altro senza tempi di inattività percepiti.
  • Cloud di controllo. Cloud Witness è un quorum del cluster di failover che usa Microsoft Archiviazione BLOB di Azure per fornire un voto sul quorum del cluster.

Dettagli dello scenario

Questa architettura viene in genere usata per il ripristino di emergenza con failover automatico di macchine virtuali e condivisioni file di Azure Stack HCI tra due posizioni fisiche all'interno di un intervallo di 5 ms di latenza di rete round trip.

Consigli

La raccomandazione seguente si applica per la maggior parte degli scenari. Seguire la raccomandazione, a meno che non si disponga di un requisito specifico che ne esegue l'override.

Usare cluster estesi per implementare il ripristino di emergenza automatizzato per carichi di lavoro virtualizzati e condivisioni file ospitate in Azure Stack HCI

Per migliorare la resilienza predefinita di Azure Stack HCI, implementare un cluster Azure Stack HCI esteso costituito da due gruppi di nodi, con un gruppo per sito. Ogni gruppo deve contenere almeno due nodi. Il numero totale di nodi in un cluster non può superare il numero massimo di nodi supportati da un cluster Azure Stack HCI. I nodi devono soddisfare i requisiti hardware HCI standard.

Un cluster esteso di Azure Stack HCI si basa sulla replica di archiviazione per eseguire una replica di archiviazione sincrona tra i volumi di archiviazione ospitati dai due gruppi di nodi nei rispettivi siti fisici. Se un errore influisce sulla disponibilità del sito primario, il cluster trasferisce automaticamente i carichi di lavoro nei nodi del sito integro per ridurre al minimo i potenziali tempi di inattività. Per i tempi di inattività pianificati o previsti nel sito primario, è possibile usare Hyper-V Live Migration per eseguire facilmente la transizione dei carichi di lavoro all'altro sito, evitando del tutto il tempo di inattività. Per questo scenario è necessario tenere presente la posizione di archiviazione. È necessario prima invertire la direzione di replica per replica di archiviazione, quindi eseguire la migrazione in tempo reale delle macchine virtuali. Si avrà un impatto sulle prestazioni fino al completamento della migrazione in tempo reale.

Nota

La replica sincrona garantisce la coerenza dell'arresto anomalo con zero perdita di dati a livello di file system durante un failover.

Attenzione

Il requisito di replica sincrono applicabile ai cluster estesi impone un limite di 5 ms di latenza di rete round trip tra due gruppi di nodi del cluster nei siti replicati. A seconda delle caratteristiche di connettività della rete fisica, questo vincolo in genere si traduce in circa 20-30 miglia fisiche.

Nota

La funzionalità di firma e crittografia di Replica archiviazione protegge automaticamente il traffico di replica.

Considerazioni

Microsoft Azure Well-Architected Framework è un set di set di principi guida seguiti in questa architettura di riferimento. Le considerazioni seguenti sono incluse nel contesto di questi set di dati.

Affidabilità

L'affidabilità garantisce che l'applicazione possa soddisfare gli impegni che l'utente ha preso con i clienti. Per altre informazioni, vedere Panoramica del pilastro dell'affidabilità.

  • Domini di errore a livello di sito. Ogni sito fisico di un cluster esteso di Azure Stack HCI rappresenta domini di errore distinti che forniscono resilienza aggiuntiva. Un dominio di errore è un set di componenti hardware che condividono un singolo punto di errore. Per essere a tolleranza di errore a un determinato livello, sono necessari più domini di errore a tale livello.

Nota

Se ogni posizione corrisponde a un sito di Active Directory Domain Services separato, il processo di provisioning del cluster configura automaticamente l'assegnazione del sito. Se non sono presenti siti di Active Directory Domain Services separati che rappresentano le due posizioni, ma i nodi si trovano in due subnet diverse, il processo di provisioning del cluster identificherà i siti in base alle assegnazioni di subnet. Se i nodi si trovano nella stessa subnet, è necessario definire in modo esplicito l'assegnazione del sito.

  • Consapevolezza del sito. Le informazioni sulla presenza nel sito consentono di controllare il posizionamento dei carichi di lavoro virtualizzati designando i siti preferiti. La specifica del sito preferito per un cluster esteso offre numerosi vantaggi, tra cui la possibilità di raggruppare i carichi di lavoro a livello di sito e di personalizzare le opzioni di voto del quorum. Per impostazione predefinita, durante un avvio a freddo, tutte le macchine virtuali usano il sito preferito, anche se è possibile configurare il sito preferito a livello di gruppo o ruolo del cluster. In questo modo è possibile allocare macchine virtuali specifiche ai rispettivi siti in modalità attiva-attiva. Dal punto di vista del quorum, la selezione del sito preferita influisce sull'allocazione dei voti in modo che favorisca tale sito. Ad esempio, se la connettività tra i due siti che ospitano nodi cluster estesi ha esito negativo e il server di controllo del cluster non è raggiungibile, il sito preferito rimane online, mentre i nodi dell'altro sito vengono rimossi.

  • Miglioramento Spazi di archiviazione diretta velocità di riparazione del volume. Spazi di archiviazione diretta fornisce eventi di risincronizzazione automatica che influiscono sulla disponibilità dei dischi all'interno del pool di archiviazione, ad esempio l'arresto di uno dei nodi del cluster o un errore hardware localizzato. Azure Stack HCI implementa un processo di risincronizzazione avanzato che opera con una granularità molto più fine rispetto a Windows Server 2019. Questo processo riduce significativamente la durata dell'operazione di risincronizzazione e riduce al minimo l'impatto potenziale di più errori hardware sovrapposti.

  • Limiti di resilienza. Azure Stack HCI offre più livelli di resilienza, ma grazie all'architettura iperconvergente, tale resilienza è soggetta a limiti imposti non solo dal quorum del cluster, ma anche dal quorum del pool.

  • Integrazione con una gamma di servizi di Azure che offrono vantaggi aggiuntivi per la resilienza. È possibile integrare carichi di lavoro virtualizzati in esecuzione in cluster Azure Stack HCI con servizi di Azure come Backup di Azure e Azure Site Recovery.

  • Failover accelerato. È possibile ottimizzare l'infrastruttura di rete e la relativa configurazione per accelerare il completamento di un failover a livello di sito. Ad esempio, è possibile sfruttare reti LAN virtuali estese (VLAN), dispositivi di astrazione di rete e valori TTL (Time to Live) più brevi nei record DNS che rappresentano risorse cluster. È anche consigliabile ridurre il periodo di resilienza predefinito, che determina il periodo di tempo durante il quale una macchina virtuale in cluster può essere eseguita nello stato isolato.

Attenzione

L'uso di cluster estesi con SDN è considerato una configurazione avanzata ed è necessario contattare System Integrator o supporto tecnico Microsoft per ulteriore assistenza.

Sicurezza

La sicurezza offre garanzie contro attacchi intenzionali e l'abuso di dati e sistemi preziosi. Per altre informazioni, vedere Panoramica del pilastro della sicurezza.

  • Protezione dei dati in transito. Replica archiviazione offre sicurezza predefinita per il traffico di replica, che include la firma dei pacchetti, la crittografia completa dei dati AES-128-GCM, il supporto per l'accelerazione della crittografia Intel AES-NI e la prevenzione dell'integrità dell'autenticazione man-in-the-middle. La replica di archiviazione usa anche Kerberos AES256 per l'autenticazione tra i nodi di replica.

  • Crittografia dei dati inattivi. Azure Stack HCI supporta Crittografia unità BitLocker per i volumi di dati, facilitando così la conformità con standard come FIPS 140-2 e HIPAA.

  • Integrazione con una gamma di servizi di Azure che offrono vantaggi aggiuntivi per la sicurezza. È possibile integrare carichi di lavoro virtualizzati in esecuzione in cluster Azure Stack HCI con servizi di Azure come Microsoft Defender per il cloud

  • Configurazione adatta ai firewall. Il traffico di Replica archiviazione richiede un numero limitato di porte aperte tra i nodi di replica.

Attenzione

Replica di archiviazione e cluster estesi di Azure Stack HCI devono funzionare all'interno di un ambiente di Active Directory Domain Services. Quando si pianifica la distribuzione dei cluster estesi di Azure Stack HCI, assicurarsi la connettività ai controller di dominio di Active Directory Domain Services in ogni sito che ospita i nodi del cluster.

Ottimizzazione dei costi

L'ottimizzazione dei costi riguarda l'analisi dei modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Panoramica del pilastro di ottimizzazione dei costi.

  • Configurazione attiva/attiva/passiva. I cluster Azure Stack HCI estesi supportano le modalità attivo-passivo e attivo-attivo. In modalità attiva-passiva, un sito primario designato viene replicato in modo unidirezionale in un altro sito che fornisce la funzionalità di ripristino di emergenza. In modalità attiva-attiva, due siti replicano i rispettivi volumi unidirezionali tra loro, fornendo funzionalità di failover in caso di errore in uno dei due siti. La modalità attivo-attivo consente di ridurre al minimo i costi di continuità aziendale senza che sia necessario un sito di ripristino di emergenza dedicato.

  • Controllo cloud e condivisione file di controllo. Una risorsa di controllo è un componente obbligatorio nei cluster Azure Stack HCI. Per implementarla, scegliere un server di controllo cloud di Azure o un server di controllo della condivisione file. Un server di controllo cloud di Azure si basa su un BLOB in un account di archiviazione di Azure designato come punto di arbitrato per evitare scenari split brain. Un server di controllo della condivisione file si basa su una condivisione file SMB (Server Message Block) per raggiungere lo stesso obiettivo.

Nota

Controllo cloud di Azure è la scelta consigliata per i cluster estesi di Azure Stack HCI, a condizione che tutti i nodi del server nel cluster abbiano connessioni Internet affidabili. Gli addebiti di Azure corrispondenti sono trascurabili; si basano sul prezzo di un BLOB di piccole dimensioni con aggiornamenti poco frequenti corrispondenti alle modifiche allo stato del cluster. Negli scenari che coinvolgono cluster estesi, un server di controllo della condivisione file deve risiedere in un terzo sito, che può aumentare significativamente i costi di implementazione a meno che il terzo sito non sia già disponibile e disponga di connessioni affidabili e esistenti ai siti che ospitano i nodi del cluster esteso.

  • Deduplicazione dati. Azure Stack HCI e Replica archiviazione supportano la deduplicazione dei dati. A partire da Windows Server 2019, la deduplicazione è disponibile nei volumi formattati con Resilient File System (ReFS), che è il file system consigliato per Azure Stack HCI. La deduplicazione consente di aumentare la capacità di archiviazione utilizzabile identificando parti duplicate di file e archiviandole una sola volta.

Attenzione

Anche se è necessario installare il servizio ruolo del server Deduplicazione dati nei server di origine e di destinazione, non abilitare Deduplicazione dati nei nodi di destinazione all'interno di un cluster esteso di Azure Stack HCI. Poiché La deduplicazione dati gestisce le scritture, deve essere eseguita solo nei nodi del cluster di origine. I nodi di destinazione ricevono sempre copie deduplicate di ogni volume.

Eccellenza operativa

L'eccellenza operativa copre i processi operativi che distribuiscono un'applicazione e la mantengono in esecuzione nell'ambiente di produzione. Per altre informazioni, vedere Panoramica del pilastro dell'eccellenza operativa.

  • Failover automatico e ripristino. Un errore del sito primario attiva il failover automatico. In seguito al failover, anche il processo di definizione della replica dal nuovo sito primario/precedente secondario al nuovo sito primario o primario precedente è automatico. Per evitare potenziali perdite di dati, il cluster impedisce il failback fino a quando i volumi replicati non vengono sincronizzati completamente.

  • Esperienza semplificata di provisioning e gestione tramite Windows Admin Center. La procedura guidata Crea cluster in Windows Admin Center offre un'interfaccia guidata che illustra il processo di creazione di un cluster esteso di Azure Stack HCI. La procedura guidata rileva se i nodi del cluster risiedono in due siti distinti Dominio di Active Directory Services (AD DS) o se i relativi indirizzi IP appartengono a due subnet diverse. Se si trovano in due subnet diverse, la procedura guidata crea e configura automaticamente i siti del cluster corrispondenti con ognuno che rappresenta un dominio di errore separato. Consente anche di designare il sito preferito. Analogamente, Windows Admin Center semplifica il processo di provisioning dei volumi replicati.

Nota

La creazione di volumi e dischi virtuali per cluster estesi è più interessata rispetto ai cluster a sito singolo. I cluster estesi richiedono almeno quattro volumi, costituiti da due volumi di dati e due volumi di log, con una coppia di volumi di dati/log in ogni sito. Quando si crea un volume di dati replicato usando Windows Admin Center, il processo effettua automaticamente il provisioning del volume di log nel sito primario e dei volumi replicati di dati e log nel sito secondario, assicurando che ognuna di esse abbia le dimensioni e le impostazioni di configurazione necessarie.

  • Supporto per il provisioning automatizzato dei cluster estesi e la gestione dell'archiviazione tramite Windows PowerShell. È possibile eseguire PowerShell in locale da uno dei server Azure Stack HCI o in remoto da un computer di gestione.

  • Integrazione con una gamma di servizi di Azure che offrono vantaggi operativi aggiuntivi. È possibile integrare carichi di lavoro virtualizzati in esecuzione in cluster Azure Stack HCI con servizi di Azure come Monitoraggio di Azure e soluzioni di Automazione di Azure, tra cui Rilevamento modifiche e Inventario e Gestione aggiornamenti. Seguendo una procedura di registrazione obbligatoria iniziale, i cluster Azure Stack HCI possono sfruttare Azure Arc per il monitoraggio e la fatturazione. L'integrazione di Azure Arc offre un'integrazione avanzata con altri servizi ibridi, ad esempio Criteri di Azure e Log Analytics. La registrazione attiva la creazione di una risorsa di Azure Resource Manager che rappresenta un cluster Azure Stack HCI, estendendo in modo efficace il piano di gestione di Azure ad Azure Stack HCI.

Efficienza prestazionale

L'efficienza delle prestazioni è la capacità di dimensionare il carico di lavoro per soddisfare in modo efficiente le richieste poste dagli utenti. Per altre informazioni, vedere Panoramica del pilastro dell'efficienza delle prestazioni.

  • Traffico di replica ottimizzato. Quando si progetta l'infrastruttura per i cluster estesi di Azure Stack HCI, prendere in considerazione il traffico della cronologia delle prestazioni del cluster di Replica archiviazione aggiuntivo, Migrazione in tempo reale e Cronologia prestazioni del cluster di replica di archiviazione tra i siti. La replica sincrona richiede almeno 1 GB di accesso diretto alla memoria remota (RDMA) o una connessione Ethernet/TCP tra siti cluster estesi. Tuttavia, a seconda del volume del traffico di replica, potrebbe essere necessaria una connessione RDMA più veloce. È anche consigliabile effettuare il provisioning di più connessioni tra siti, che offre vantaggi di resilienza e consente di separare il traffico di Replica archiviazione dal traffico di migrazione in tempo reale Hyper-V.

Attenzione

RDMA è abilitato per impostazione predefinita per tutto il traffico tra i nodi del cluster nello stesso sito nella stessa subnet. RDMA è disabilitato e non è supportato tra siti o tra subnet diverse. È consigliabile disabilitare SMB diretto per il traffico tra siti o implementare provisioning aggiuntivi che lo separano dal traffico tra nodi all'interno dello stesso sito.

  • Supporto per la sincronizzazione iniziale con seeding. È possibile implementare la sincronizzazione iniziale con seeding negli scenari in cui il tempo di sincronizzazione iniziale deve essere ridotto al minimo o in cui è disponibile una larghezza di banda limitata tra i due siti che ospitano il cluster esteso.

  • Elaborazione ottimizzata dell'I/O di archiviazione. Garantire una configurazione ottimale dei volumi di dati e di log replicati, inclusi il livello di prestazioni, il volume e il ridimensionamento del settore, il tipo di disco e il file system.

Nota

Windows Admin Center assegna automaticamente la configurazione ottimale se viene usata per il provisioning di volumi di cluster estesi.

Passaggi successivi