Affidabilità nella formazione community

La formazione della community è una soluzione basata sul cloud basata su Azure in grado di offrire programmi di formazione su larga scala e diffusi con alta qualità ed efficienza. Con la formazione della community, le organizzazioni di tutte le dimensioni e i tipi possono eseguire programmi di formazione su larga scala per le loro comunità interne ed esterne. Le comunità possono includere lavoratori in prima linea, forza lavoro estesa, un ecosistema partner, una rete di volontari e beneficiari di programmi.

Questo articolo descrive il supporto per l'affidabilità in Formazione community e illustra sia la resilienza a livello di area con le zone di disponibilità che il ripristino di emergenza e la continuità aziendale. Per una panoramica più dettagliata di un principio di affidabilità in Azure, vedere Affidabilità di Azure.

Supporto della zona di disponibilità

Le zone di disponibilità di Azure sono almeno tre gruppi separati fisicamente di data center in ogni area di Azure. I data center in ogni zona sono dotati di impianti indipendenti per l'alimentazione, il raffreddamento e la connettività di rete. In caso di errore in una zona locale, le zone di disponibilità sono progettate in modo tale che i servizi regionali, la capacità e la disponibilità elevata della zona interessata siano supportati dalle altre due zone.

Gli errori possono essere correlati a software e hardware o a eventi come terremoti, inondazioni e incendi. La tolleranza agli errori viene raggiunta con la ridondanza e l'isolamento logico dei servizi di Azure. Per informazioni più dettagliate sulle zone di disponibilità in Azure, vedere Aree e zone di disponibilità.

I servizi abilitati per le zone di disponibilità sono progettati per fornire il livello adeguato di affidabilità e flessibilità. Possono essere configurate in due modi. Possono essere ridondanti della zona, con replica automatica tra le zone o a zona, con istanze aggiunte a una zona specifica. Questi approcci possono essere combinati. Per altre informazioni sulle architetture a zona e con ridondanza della zona, vedere Raccomandazioni per l'utilizzo delle zone e delle aree.

Il training della community usa le zone di disponibilità di Azure per offrire disponibilità elevata e tolleranza di errore all'interno di un'area di Azure. Il training della community offre supporto sia per il controllo che per la zona di disponibilità del piano dati:

  • Il piano di controllo è ridondante nella zona nelle aree primarie di disponibilità.

  • Il piano dati può essere zonale o ridondante della zona, a seconda di ciò che si sceglie per le proprie esigenze. È tuttavia consigliabile scegliere una distribuzione con ridondanza della zona per evitare la perdita di dati e mantenere la disponibilità del servizio durante un'interruzione della zona.

Prerequisiti

  • Le zone di disponibilità sono supportate per gli SKU di training della community seguenti:

    • Standard (scala inferiore degli utenti)
    • Premium (scalabilità elevata degli utenti)
  • La formazione della community è supportata solo nelle aree abbinate. Ogni area secondaria viene distribuita con una configurazione di zona. La tabella seguente illustra tutte le aree che supportano le zone di disponibilità per il training della community, insieme all'area associata.

Area primaria Area abbinata
UKSouth UKWest
AustraliaEast AustraliaSoutheast
EastUS WestUS
EastUS2 CentralUS
NordEurope Europa occidentale
WestUS3 EastUS
SveziaCentral SveziaSouth

Supporto del failover a livello di zona

Il training della community usa molti servizi di Azure di dipendenza, ad esempio il servizio app e Azure SQL. Quando si sceglie una distribuzione con ridondanza della zona, Community Training crea anche offerte ridondanti di zona di tali risorse del servizio di Azure sottostanti. Se una zona ha esito negativo, tutte le risorse, incluse le risorse di dipendenza, eseguono il failover in una delle zone integre.

Creare una risorsa con la zona di disponibilità abilitata

Il training della community fornisce la configurazione per le zone di disponibilità solo al momento della creazione dell'istanza. Se si vuole modificare la configurazione della zona di disponibilità dopo la creazione dell'istanza, sarà necessario creare una nuova istanza. Per informazioni su come creare l'istanza di Community Training, vedere Create Community Training (Creare una formazione community).

Esperienza di riduzione della zona

  • Zonale. Durante un'interruzione a livello di zona, la formazione della community può comportare interruzioni complete o parziali del servizio. La misura in cui è disponibile dipende da vari fattori, ad esempio se l'intero data center è inattivo o se un servizio di dipendenza specifico non è più disponibile in tale zona.

  • Ridondanza della zona. Durante un'interruzione a livello di zona, non è consigliabile avere alcun impatto sulle risorse di cui è stato effettuato il provisioning. Tuttavia, è consigliabile prepararsi per una breve interruzione della comunicazione con tali risorse. In una situazione di arresto della zona, i client ricevono in genere codici di errore 409, nonché la logica di ripetizione dei tentativi di ristabilire le connessioni a intervalli appropriati. Le nuove richieste vengono indirizzate a nodi integri senza alcun impatto sull'utente. Durante le interruzioni a livello di zona, gli utenti possono creare nuove risorse e ridimensionare correttamente quelli esistenti.

Continuità aziendale e ripristino di emergenza

Il ripristino di emergenza si occupa del ripristino in caso di eventi a impatto elevato, come disastri naturali o distribuzioni non riuscite che comportano tempi di inattività e perdita di dati. Indipendentemente dalla causa, il miglior rimedio per un'emergenza è un piano di ripristino ben definito e testato e una progettazione di applicazioni che supporta attivamente tale ripristino. Prima di iniziare a pensare a un piano di ripristino di emergenza, vedere Raccomandazioni per la progettazione di una strategia di ripristino di emergenza.

Nell'ambito del ripristino di emergenza, Microsoft usa il modello di responsabilità condivisa. In un modello basato sulla responsabilità condivisa, Microsoft garantisce che l'infrastruttura di base e i servizi della piattaforma siano disponibili. Allo stesso tempo, molti servizi di Azure non replicano i dati in modo automatico o eseguono il fallback da un'area con errore per eseguire la replica incrociata in un'altra area abilitata. Per tali servizi, l'utente ha la responsabilità di configurare un piano di ripristino di emergenza che funzioni per i propri carichi di lavoro. La maggior parte dei servizi che eseguono offerte sulla piattaforma distribuita come servizio di Azure forniscono funzionalità e linee guida per supportare il ripristino di emergenza ed è possibile usare funzionalità specifiche del servizio per supportare un ripristino rapido e sviluppare un piano di ripristino di emergenza.

Il team Microsoft Community Training gestisce l'intera procedura di ripristino di emergenza per la formazione della community. Il ripristino di emergenza non è attivo-attivo o attivo passivo, ma si basa invece sul ripristino dal backup più recente disponibile dei servizi di Azure. Il team di training della community crea manualmente tutte le risorse nell'area abbinata dal backup dei dati.

Nota

Il ripristino di emergenza per la formazione della community è supportato solo nelle aree abbinate.

Ripristino di emergenza nell'area geografica in più aree

  • In un'emergenza a livello di area, il piano di controllo viene sottoposto manualmente a failover nell'area abbinata. Prima del completamento del failover, è necessario prevedere una riduzione del servizio nel tempo. Dopo il failover, sono supportate solo le operazioni di sola lettura finché l'area di emergenza non torna online. Il servizio viene eseguito manualmente il failback nell'area originale dopo il ripristino online di tutte le operazioni. L'obiettivo del punto di ripristino (RPO) dovrebbe essere di 10 minuti; Obiettivo tempo di ripristino (RTO), 24 ore.

  • Per il piano dati, Community Training offre il ripristino di emergenza gestito da Microsoft. Per usare il ripristino di emergenza gestito, è necessario abilitare il ripristino di emergenza durante la creazione dell'istanza di Training della community in Azure. Dopo aver abilitato il ripristino di emergenza, Microsoft gestisce il backup dell'archiviazione e del database nell'area abbinata. L'obiettivo del punto di ripristino (RPO) dovrebbe essere di 12 ore; Obiettivo tempo di ripristino (RTO), 48 ore.

Nota

L'obiettivo RTO dipende dalle dimensioni del database e dell'archiviazione, dalla latenza tra l'area abbinata. Capacità del database o della macchina virtuale di archiviazione (SKU). RPO dipende dalle risorse di Azure sottostanti, ad esempio Azure SQL e Archiviazione di Azure. Per altre informazioni su RTO e RPO, vedere Panoramica del ripristino di emergenza.

Rilevamento, notifica e gestione di interruzioni

Quando un controllo integrità del training della community rileva un'interruzione di qualsiasi servizio e in qualsiasi area Microsoft richiede il consenso per il failover nell'area abbinata. Microsoft informa l'utente sulle funzionalità disponibili durante la procedura di ripristino di emergenza. Dopo che Microsoft riceve il consenso, il team di formazione della community può avviare la procedura di ripristino di emergenza.

Importante

Gli studenti non saranno in grado di utilizzare funzionalità audio/video finché l'area primaria non è operativa. È consigliabile evitare operazioni di caricamento multimediale fino a quando il sito primario non è operativo.

Resilienza della capacità e del ripristino di emergenza proattivo

Microsoft e i suoi clienti operano con il modello di responsabilità condivisa. Quando un'area è inattiva, non solo l'istanza community training viene migrata nell'area abbinata, ma anche tutti i carichi di lavoro di prodotto e clienti vengono migrati anche nell'area abbinata. Questa procedura può causare una carenza di risorse nell'area o nel data center associato. Di conseguenza, la disponibilità del ripristino di emergenza dipende dalla capacità disponibile delle risorse di Azure sottostanti.

Passaggi successivi