Configurare il ripristino di emergenza su larga scala per macchine virtuali VMware/server fisici

Articolo
08/31/2023

Questo articolo descrive come configurare il ripristino di emergenza in Azure per numeri di grandi dimensioni (>1000) di macchine virtuali VMware locali o server fisici nell'ambiente di produzione usando il servizio Azure Site Recovery.

Definire la strategia BCDR

Come parte della strategia di continuità aziendale e ripristino di emergenza (BCDR), si definiscono gli obiettivi del punto di ripristino (RPO) e gli obiettivi di tempo di ripristino (RTOs) per le app e i carichi di lavoro aziendali. RTO misura la durata del tempo e del livello di servizio all'interno del quale deve essere ripristinata e disponibile un'app aziendale per evitare problemi di continuità.

Site Recovery fornisce la replica continua per macchine virtuali VMware e server fisici e un contratto di servizio per RTO.
Durante il piano per il ripristino di emergenza su larga scala per le macchine virtuali VMware e individuare le risorse di Azure necessarie, è possibile specificare un valore RTO che verrà usato per i calcoli della capacità.

Procedure consigliate

Alcune procedure consigliate generali per il ripristino di emergenza su larga scala. Queste procedure consigliate vengono illustrate in modo più dettagliato nelle sezioni successive del documento.

Identificare i requisiti di destinazione: stimare le esigenze di capacità e risorse in Azure prima di configurare il ripristino di emergenza.
Pianificare i componenti Site Recovery: capire quali componenti Site Recovery (server di configurazione, server di elaborazione) è necessario soddisfare la capacità stimata.
Configurare uno o più server di elaborazione con scalabilità orizzontale: non usare il server di elaborazione in esecuzione per impostazione predefinita nel server di configurazione.
Eseguire gli aggiornamenti più recenti: il team Site Recovery rilascia nuove versioni dei componenti Site Recovery regolarmente e assicurarsi di eseguire le versioni più recenti. Per informazioni utili, tenere traccia delle novità per gli aggiornamenti e abilitare e installare gli aggiornamenti durante la versione.
Monitorare in modo proattivo: durante il ripristino di emergenza e l'esecuzione, è consigliabile monitorare in modo proattivo lo stato e l'integrità dei computer replicati e delle risorse dell'infrastruttura.
Drill-on di ripristino di emergenza: è necessario eseguire i drill-on di ripristino di emergenza regolarmente. Questi non influiscono sull'ambiente di produzione, ma consentono di assicurarsi che il failover in Azure funzioni come previsto quando necessario.

Raccogliere informazioni sulla pianificazione della capacità

Raccogliere informazioni sull'ambiente locale per valutare e stimare le esigenze di capacità di destinazione (Azure).

Per VMware, eseguire Deployment Planner per macchine virtuali VMware per eseguire questa operazione.
Per i server fisici, raccogliere manualmente le informazioni.

Eseguire Deployment Planner per macchine virtuali VMware

Deployment Planner consente di raccogliere informazioni sull'ambiente locale VMware.

Eseguire Deployment Planner durante un periodo che rappresenta una varianza tipica per le macchine virtuali. In questo modo verranno generate stime e raccomandazioni più accurate.
È consigliabile eseguire Deployment Planner nel computer del server di configurazione, poiché Planner calcola la velocità effettiva dal server in cui è in esecuzione. Altre informazioni sulla misurazione della velocità effettiva.
Se non si dispone ancora di un server di configurazione configurato:
- Ottenere una panoramica dei componenti Site Recovery.
- Configurare un server di configurazione per eseguire Deployment Planner.

Eseguire quindi Planner come indicato di seguito:

Informazioni su Deployment Planner. È possibile scaricare la versione più recente dal portale o scaricarla direttamente.
Esaminare i prerequisiti e gli aggiornamenti più recenti per Deployment Planner e scaricare ed estrarre lo strumento.
Eseguire Deployment Planner nel server di configurazione.
Generare un report per riepilogare le stime e le raccomandazioni.
Analizzare le raccomandazioni e le stime dei costi del report.

Nota

Per impostazione predefinita, lo strumento è configurato per il profilo e genera report per un massimo di 1000 macchine virtuali. È possibile modificare questo limite aumentando il valore della chiave MaxVMsSupported nel file ASRDeploymentPlanner.exe.config.

Pianificare i requisiti e la capacità di destinazione (Azure)

Usando le stime e le raccomandazioni raccolte, è possibile pianificare le risorse e la capacità di destinazione. Se è stato eseguito Deployment Planner per le macchine virtuali VMware, è possibile usare numerosi consigli del report per facilitare l'utente.

Macchine virtuali compatibili: usare questo numero per identificare il numero di macchine virtuali pronte per il ripristino di emergenza in Azure. Le raccomandazioni sulla larghezza di banda di rete e i core di Azure si basano su questo numero.
Larghezza di banda di rete necessaria: si noti che la larghezza di banda necessaria per la replica differenziale delle macchine virtuali compatibili.
- Quando si esegue Planner, si specifica il RPO desiderato in pochi minuti. I consigli illustrano la larghezza di banda necessaria per soddisfare tale RPO 100% e il 90% del tempo.
- Le raccomandazioni sulla larghezza di banda di rete tengono conto della larghezza di banda necessaria per il numero totale di server di configurazione e server di elaborazione consigliati in Planner.
Core di Azure necessari: tenere presente il numero di core necessari nell'area di Azure di destinazione, in base al numero di macchine virtuali compatibili. Se non sono presenti core sufficienti, in fase di failover Site Recovery non sarà possibile creare le macchine virtuali di Azure necessarie.
Dimensioni batch di macchine virtuali consigliate: le dimensioni batch consigliate si basano sulla possibilità di completare la replica iniziale per il batch entro 72 ore per impostazione predefinita, durante la riunione di un RPO pari al 100%. Il valore dell'ora può essere modificato.

È possibile usare questi consigli per pianificare risorse di Azure, larghezza di banda di rete e batch di macchine virtuali.

Pianificare le sottoscrizioni e le quote di Azure

Si vuole assicurarsi che le quote disponibili nella sottoscrizione di destinazione siano sufficienti per gestire il failover.

Attività	Dettagli	Azione
Controllare i core	Se i core nella quota disponibile non sono uguali o superano il numero totale di destinazione al momento del failover, i failover avranno esito negativo.	Per le macchine virtuali VMware, verificare che siano presenti core sufficienti nella sottoscrizione di destinazione per soddisfare la raccomandazione di base di Deployment Planner. Per i server fisici, verificare che i core di Azure soddisfino le stime manuali. Per controllare le quote, nella sottoscrizione portale di Azure > fare clic su Utilizzo + quote. Altre informazioni sull'aumento delle quote.
Controllare i limiti di failover	Il numero di failover non deve superare Site Recovery limiti di failover.	Se i failover superano i limiti, è possibile aggiungere sottoscrizioni e eseguire il failover a più sottoscrizioni o aumentare la quota per una sottoscrizione.

Limiti di failover

I limiti indicano il numero di failover supportati da Site Recovery entro un'ora, presupponendo tre dischi per ogni computer.

Che cos'è la conformità? Per avviare una macchina virtuale di Azure, Azure richiede che alcuni driver siano nello stato di avvio e servizi come DHCP da impostare per avviare automaticamente.

I computer conformi avranno già queste impostazioni.
Per i computer che eseguono Windows, è possibile controllare in modo proattivo la conformità e renderli conformi se necessario. Altre informazioni
I computer Linux vengono inseriti in conformità solo al momento del failover.

Il computer è conforme ad Azure?	Limiti delle macchine virtuali di Azure (failover del disco gestito)
Sì	2000
No	1000

I limiti presuppongono che siano in corso altri processi nell'area di destinazione per la sottoscrizione.
Alcune aree di Azure sono più piccole e potrebbero avere limiti leggermente inferiori.

Pianificare l'infrastruttura e la connettività delle macchine virtuali

Dopo il failover in Azure è necessario che i carichi di lavoro funzionino in locale e consentano agli utenti di accedere ai carichi di lavoro in esecuzione nelle macchine virtuali di Azure.

Altre informazioni sul failover dell'infrastruttura locale di Active Directory o DNS in Azure.
Altre informazioni sulla preparazione della connessione alle macchine virtuali di Azure dopo il failover.

Pianificare la capacità e i requisiti di origine

È importante disporre di server di configurazione sufficienti e server di elaborazione con scalabilità orizzontale per soddisfare i requisiti di capacità. Quando si inizia la distribuzione su larga scala, iniziare con un singolo server di configurazione e un server di elaborazione con scalabilità orizzontale singola. Quando si raggiungono i limiti prescritti, aggiungere altri server.

Nota

Per le macchine virtuali VMware, Deployment Planner fornisce alcune raccomandazioni relative alla configurazione e ai server di elaborazione necessari. È consigliabile usare le tabelle incluse nelle procedure seguenti, anziché seguire la raccomandazione di Deployment Planner.

Configurare un server di configurazione

La capacità del server di configurazione è influenzata dal numero di computer replicati e non dalla frequenza di varianza dei dati. Per determinare se sono necessari server di configurazione aggiuntivi, usare questi limiti di macchina virtuale definiti.

CPU	Memoria	Disco cache	Limite del computer replicato
8 vCPU 2 socket * 4 core a 2,5 Ghz	16 GB	600 GB	Fino a 550 computer Si supponga che ogni computer abbia tre dischi di 100 GB ciascuno.

Questi limiti sono basati su un server di configurazione configurato usando un modello OVF.
I limiti presuppongono che non si usi il server di elaborazione in esecuzione per impostazione predefinita nel server di configurazione.

Se è necessario aggiungere un nuovo server di configurazione, seguire queste istruzioni:

Configurare un server di configurazione per il ripristino di emergenza delle macchine virtuali VMware usando un modello OVF.
Configurare manualmente un server di configurazione per i server fisici o per le distribuzioni VMware che non possono usare un modello OVF.

Quando si configura un server di configurazione, tenere presente che:

Quando si configura un server di configurazione, è importante considerare la sottoscrizione e l'insieme di credenziali all'interno del quale risiede, perché non devono essere modificati dopo l'installazione. Se è necessario modificare l'insieme di credenziali, è necessario annullare l'associazione del server di configurazione dall'insieme di credenziali e registrarlo nuovamente. Questa operazione arresta la replica delle macchine virtuali nell'insieme di credenziali.
Se si vuole configurare un server di configurazione con più schede di rete, è necessario eseguire questa operazione durante la configurazione. Non è possibile eseguire questa operazione dopo la registrazione del server di configurazione nell'insieme di credenziali.

Configurare un server di elaborazione

La capacità del server di elaborazione è influenzata dalla frequenza di varianza dei dati e non dal numero di computer abilitati per la replica.

Per le distribuzioni di grandi dimensioni, è necessario avere sempre almeno un server di elaborazione con scalabilità orizzontale.
Per determinare se sono necessari server aggiuntivi, usare la tabella seguente.
È consigliabile aggiungere un server con la specifica più elevata.

CPU	Memoria	Disco cache	Tasso di abbandono
12 vCPU 2 socket*6 core a 2,5 Ghz	24 GB	1 TB	Fino a 2 TB al giorno

Configurare il server di elaborazione come segue:

Esaminare i prerequisiti.
Installare il server nel portale o dalla riga di comando.
Configurare i computer replicati per l'uso del nuovo server. Se sono già presenti computer che eseguono la replica:
- È possibile spostare un intero carico di lavoro del server di elaborazione nel nuovo server di elaborazione.
- In alternativa, è possibile spostare macchine virtuali specifiche nel nuovo server di elaborazione.

Abilitare la replica su larga scala

Dopo aver pianificato la capacità e aver distribuito i componenti e l'infrastruttura necessari, abilitare la replica per un numero elevato di macchine virtuali.

Ordinare i computer in batch. È possibile abilitare la replica per le macchine virtuali all'interno di un batch e quindi passare al batch successivo.
- Per le macchine virtuali VMware, è possibile usare le dimensioni batch di vm consigliate nel report Deployment Planner.
- Per i computer fisici, è consigliabile identificare batch basati su computer con dimensioni e quantità di dati simili e sulla velocità effettiva di rete disponibile. L'obiettivo è quello di eseguire il batch di computer che probabilmente completano la replica iniziale in circa la stessa quantità di tempo.
Se la varianza del disco per un computer è elevata o supera i limiti in Deployment thePlanner, è possibile spostare file non critici che non è necessario replicare (ad esempio dump di log o file temporanei) dal computer. Per le macchine virtuali VMware, è possibile spostare questi file in un disco separato e quindi escludere tale disco dalla replica.
Prima di abilitare la replica, verificare che i computer soddisfino i requisiti di replica.
Configurare criteri di replica per macchine virtuali VMware o server fisici.
Abilitare la replica per macchine virtuali VMware o server fisici. Viene avviata la replica iniziale per i computer selezionati.

Monitorare la distribuzione

Dopo aver avviato la replica per il primo batch di macchine virtuali, avviare il monitoraggio della distribuzione come indicato di seguito:

Assegnare un amministratore del ripristino di emergenza per monitorare lo stato di integrità dei computer replicati.
Monitorare gli eventi per gli elementi replicati e l'infrastruttura.
Monitorare l'integrità dei server di elaborazione con scalabilità orizzontale.
Iscriversi per ricevere notifiche tramite posta elettronica per gli eventi, per semplificare il monitoraggio.
Eseguire esercitazioni regolari sul ripristino di emergenza per assicurarsi che tutto funzioni come previsto.

Pianificare failover su larga scala

In caso di emergenza, potrebbe essere necessario eseguire il failover di un numero elevato di computer/carichi di lavoro in Azure. Preparare questo tipo di evento come indicato di seguito.

È possibile prepararsi in anticipo per il failover come indicato di seguito:

Preparare l'infrastruttura e le macchine virtuali in modo che i carichi di lavoro siano disponibili dopo il failover e in modo che gli utenti possano accedere alle macchine virtuali di Azure.
Si notino i limiti di failover descritti in precedenza in questo documento. Assicurarsi che i failover siano compresi in questi limiti.
Eseguire esercitazioni regolari sul ripristino di emergenza. Le esercitazioni consentono di:
- Individuare lacune nella distribuzione prima del failover.
- Stimare l'RTO end-to-end per le app.
- Stimare l'RPO end-to-end per i carichi di lavoro.
- Identificare i conflitti tra intervalli di indirizzi IP.
- Durante l'esecuzione delle esercitazioni, è consigliabile non usare le reti di produzione per le esercitazioni e pulire i failover di test dopo ogni esercitazione.

Per eseguire un failover su larga scala, è consigliabile:

Creare piani di ripristino per il failover del carico di lavoro.
- Ogni piano di ripristino può attivare il failover di un massimo di 100 computer.
- Ulteriori informazioni sui piani di ripristino.
Aggiungere Automazione di Azure script del runbook ai piani di ripristino per automatizzare le attività manuali in Azure. Le attività tipiche includono la configurazione dei servizi di bilanciamento del carico, l'aggiornamento di DNS e così via. Scopri di più
Prima del failover, preparare i computer Windows in modo che siano conformi all'ambiente Azure. I limiti di failover sono superiori per i computer conformi. Altre informazioni sui runbook.
Attivare il failover con il cmdlet PowerShell Start-AzRecoveryServicesAsrPlannedFailoverJob , insieme a un piano di ripristino.

Passaggi successivi

Monitorare Site Recovery