Raccomandazioni per la progettazione multi-area a disponibilità elevata
Si applica a questa raccomandazione per l'affidabilità di Azure Well-Architected Framework:
RE:05 | Aggiungere ridondanza a livelli diversi, in particolare per i flussi critici, per soddisfare gli obiettivi di affidabilità. Prendere in considerazione componenti dell'infrastruttura ridondanti, ad esempio calcolo e rete, e più istanze della soluzione. |
---|
guide correlate :ridondanza | Uso di zone di disponibilità e aree
Questa guida descrive le raccomandazioni per la progettazione di un ambiente cloud multi-area a disponibilità elevata. La disponibilità elevata è una base fondamentale per la progettazione per l'affidabilità. Un'architettura a disponibilità elevata consente di evitare il tempo di inattività il più possibile e di recuperare in modo efficiente se si verifica un tempo di inattività.
attivo-attivo e attivo-passivo sono tipi di architettura generali che possono essere applicati in modi diversi, a seconda della piattaforma in cui si distribuisce l'ambiente. Questa guida è incentrata sulla progettazione di un ambiente cloud in più aree. In Azure è anche possibile progettare un'architettura attiva-attiva o attiva-passiva all'interno di una singola regione usando zone di disponibilità. Per indicazioni dettagliate sulla progettazione di un'architettura a disponibilità elevata usando le zone di disponibilità, vedere la guida Azure Well-Architected Framework.
Strategie di progettazione chiave
Active-active e active-passive sono i due approcci fondamentali per progettare un ambiente cloud a disponibilità elevata. Gli ambienti attivi sono progettati per gestire i carichi di produzione in ogni area in cui si distribuisce il carico di lavoro. Gli ambienti attivi-passivi sono progettati per gestire i carichi di produzione solo nell'area primaria, ma eseguire il failover nell'area secondaria (passiva) quando necessario. La selezione delle aree di Azure migliori per il carico di lavoro è una parte fondamentale della progettazione di un ambiente a più aree a disponibilità elevata. Per indicazioni sulla selezione delle aree di Azure, vedere la guida Selezionare aree di Azure.
In questa sezione vengono descritte le opzioni di progettazione da considerare quando si valuta ogni modello e si affina l'architettura per soddisfare i requisiti aziendali.
Per indicazioni sulla progettazione del carico di lavoro in modo ripetibile e scalabile, consultare i modelli di distribuzione . Questo modello di progettazione consente di ottimizzare la progettazione a disponibilità elevata per una gestione efficiente.
Le sezioni seguenti descrivono le opzioni di progettazione dei due modelli.
Distribuire in modalità attivo-attivo per zero periodi di inattività
Active-active at capacity: indicatori di distribuzione con mirroring in due o più aree di Azure, ognuno configurato per gestire i carichi di lavoro di produzione per l'area o le aree gestite e scalabili per gestire i carichi di lavoro da altre aree in caso di interruzione a livello di area.
Rete: usare latenza di rete o instradamento globale ponderato per distribuire il traffico tra le regioni.
Replica e coerenza dei dati: usare un archivio dati distribuito a livello globale, ad esempio azure Cosmos DB per funzionalità di lettura e scrittura in più aree. Per i database relazionali, usare repliche leggibili con stringhe di connessione di sola lettura.
Vantaggio di questa progettazione: costi operativi inferiori rispetto a una progettazione sovradimensionata.
Svantaggio di questa progettazione: possibile riduzione delle prestazioni dell'esperienza utente in caso di aumento delle prestazioni per soddisfare le esigenze di un carico completo se si verifica un'interruzione di un'altra area.
attivo-attivo con sovraprovisionamento: stampi di distribuzione con mirroring in due o più regioni di Azure, ciascuno sovraprovisionato per gestire i carichi di lavoro di produzione della propria regione o delle proprie regioni, e per gestire i carichi provenienti da altre regioni in caso di un'interruzione regionale.
Rete: usare latenza o ponderata routing globale per distribuire il traffico tra le aree.
Replica e coerenza dei dati: usare un archivio dati distribuito a livello globale, ad esempio azure Cosmos DB per funzionalità di lettura e scrittura in più aree. Per i database relazionali, usare repliche leggibili con stringhe di connessione di sola lettura.
Vantaggio di questa progettazione: la progettazione più resiliente possibile.
Svantaggio di questa progettazione: costi operativi più elevati rispetto a una progettazione scalabile.
Vantaggi comuni di entrambe le progettazioni: resilienza elevata e basso rischio di interruzione completa del carico di lavoro.
Svantaggi comuni di entrambe le progettazioni: costi operativi più elevati e carico di gestione dovuti a vari fattori, tra cui la necessità di gestire la sincronizzazione dello stato e dei dati dell'applicazione.
Distribuire in modalità attivo-passivo per il ripristino di emergenza
Riserva attiva: Una regione primaria e una o più regioni secondarie. L'area secondaria viene distribuita con il minimo possibile di calcolo e dimensionamento dei dati e viene eseguita in assenza di carico. Questa zona è nota come zona di riserva calda. In caso di failover, le risorse di calcolo e dati vengono ridimensionate per gestire il carico dall'area primaria.
Networking: Utilizzare la priorità per il routing globale con priorità.
Replica e coerenza dei dati: replicare il database nell'area passiva e usare le funzionalità di failover automatico delle soluzioni PaaS (Platform as a Service) come azure Cosmos DB e database SQL di Azure.
Vantaggio di questa progettazione: tempo di recupero più breve tra le progettazioni attive-passive.
Svantaggio di questa progettazione: costo operativo più elevato tra i progetti attivi-passivi.
di riserva ad accesso sporadico: un'area primaria e una o più aree secondarie. L'area secondaria viene ridimensionata per gestire il carico completo, ma tutte le risorse di calcolo vengono arrestate. Questa area è nota come area di scorta fredda. È necessario avviare le risorse prima del failover.
Rete: usare priorità routing globale.
Replica e coerenza dei dati: replicare il database nell'area passiva e usare le funzionalità di failover automatico delle soluzioni PaaS, ad esempio azure Cosmos DB e database SQL di Azure.
Vantaggio di questa progettazione: costi operativi inferiori rispetto alla progettazione di riserva a caldo.
Svantaggio di questo design: tempo di recupero più lungo rispetto al design di riserva calda.
Ridistribuire in caso di emergenza: un'area primaria e una o più aree secondarie. Solo la rete necessaria viene distribuita nell'area secondaria. Gli operatori devono eseguire script di provisioning nell'area secondaria per gestire il failover dei carichi di lavoro. Questa progettazione è nota come ridistribuzione in caso di disastro.
Vantaggi comuni delle progettazioni attive-passive: costi operativi inferiori e carico di gestione meno quotidiano rispetto alle progettazioni attive.Common advantages of active-passive design: Lower operating cost and less day-to-day management burden than active-active design. Non è necessario sincronizzare lo stato dell'applicazione.
Svantaggi comuni delle progettazioni attive-passive: processo di recupero più lungo e più complesso. Maggiore probabilità di richiedere un intervento manuale per un failover riuscito.
Nota
Indipendentemente dalla progettazione a disponibilità elevata, ricordarsi di configurare la ridondanza per i servizi di supporto come l'infrastruttura di Azure DevOps, i jump box, il monitoraggio e qualsiasi altro servizio critico necessario per amministrare il carico di lavoro.
Facilitazione di Azure
Azure Front Door combina la funzionalità di routing globale di Gestione traffico di Azure con un sistema di distribuzione di contenuti e un firewall per applicazioni web per gestire il carico di lavoro a disponibilità elevata.
azure Cosmos DB è una piattaforma di database NoSQL distribuita a livello globale che consente di eseguire un ambiente attivo-attivo e ridurre al minimo la probabilità di tempi di inattività quando si verifica un'interruzione a livello di area.
Collegamenti correlati
Elenco di controllo per l'affidabilità
Fare riferimento al set completo di raccomandazioni.