Panoramica sulla resilienza e sulla continuità

In che modo Microsoft garantisce la continuità aziendale se si verifica un'emergenza o un'altra minaccia alla disponibilità del servizio?

Il team di Microsoft Enterprise Resilience and Crisis Management (ERCM) supervisiona la gestione della continuità aziendale e le attività di ripristino di emergenza nei servizi Microsoft e nelle offerte cloud. I rappresentanti delle business unit Microsoft si coordinano con il team ercm per sviluppare piani di continuità aziendale e convalidare la conformità ai requisiti di continuità aziendale.

Il ciclo di vita di Business Continuity Management (BCM) è alla base della metodologia BCM. Questo processo in tre fasi è progettato per essere adattabile in modo che possa essere implementato da un'ampia gamma di modelli di business in Microsoft. Inizia con una fase di valutazione per identificare i processi e gli obiettivi critici che devono essere inclusi nel programma di continuità aziendale. La fase di valutazione richiede anche un'analisi dell'impatto aziendale . La fase di pianificazione è incentrata sullo sviluppo e l'implementazione di strategie di resilienza e ripristino e sulla relativa documentazione nei piani ufficiali di continuità aziendale. Infine, La convalida delle funzionalità testa i piani di continuità aziendale e le relative implementazioni per verificare l'efficacia e identificare i potenziali miglioramenti.

Microsoft Servizi online le strategie di continuità aziendale usano la ridondanza hardware, di rete e dei data center. La replica dei dati tra data center offre disponibilità e affidabilità elevate durante un evento imprevisto irreversibile. Aumenta anche la resilienza agli eventi imprevisti banali, ad esempio errori hardware isolati o danneggiamento dei dati.

In che modo Microsoft testa i piani di continuità aziendale e ripristino di emergenza?

I criteri di Microsoft Enterprise Resilience and Crisis Management (ERCM) stabiliscono che tutti i piani microsoft di continuità aziendale e ripristino di emergenza devono essere testati, aggiornati ed esaminati su base annuale. Microsoft Servizi online testare i piani di continuità aziendale almeno ogni anno per i criteri ERCM. Dopo la creazione e la revisione dei report azione per convalidare, testare i risultati e informare gli aggiornamenti del piano in risposta a eventuali problemi rilevati durante i test.

Per convalidare le strategie di resilienza e ripristino rispetto a un'ampia gamma di potenziali eventi imprevisti, il programma ERCM definisce più categorie di scenari di test che interessano persone, posizioni e tecnologia. Il livello di convalida necessario per ogni servizio è basato sulla relativa criticità, per cui i servizi con la maggiore criticità ricevono una convalida più rigorosa. Ogni team del servizio online Microsoft testa il piano di continuità aziendale in base alle linee guida di ERCM per misurare l'efficacia del piano e la disponibilità del team di servizio a eseguire il piano.

Le linee guida di ERCM, le revisioni annuali dei piani di continuità aziendale e la convalida delle funzionalità devono aver luogo entro 12 mesi dall'ultima revisione. La convalida delle funzionalità deve includere la revisione della documentazione di supporto, ad esempio l'BIA, per garantire che rimanga accurata. Microsoft rende disponibili ai clienti i risultati della convalida delle funzionalità per selezionare Microsoft Servizi online tramite report trimestrali.

In che modo Microsoft Servizi online garantire che la capacità del sistema soddisfi la domanda?

La pianificazione della capacità consente ai team di servizi di allocare le risorse necessarie per supportare la disponibilità dei servizi online Microsoft. È necessaria una pianificazione regolare della capacità nell'ambito del programma ERCM di Microsoft. I team di servizio esaminano i dati sulla capacità durante le revisioni trimestrali e durante le situazioni di emergenza che richiedono una maggiore revisione della capacità.

I dati non elaborati per la pianificazione della capacità vengono gestiti da ogni team di servizio e includono metriche come l'elaborazione del sistema, la memoria e la capacità hardware. Le revisioni pianificate usano un modello della capacità corrente del sistema e lo testano in base alle esigenze previste in situazioni di emergenza. Se il modello indica lacune nella capacità, le modifiche proposte alla capacità del sistema vengono sottoposte alla leadership del team di assistenza per la revisione. Le modifiche approvate vengono incorporate in un nuovo modello prima dell'implementazione da parte dei tecnici del team di assistenza.

In che modo Microsoft Servizi online mantenere la disponibilità del servizio durante gli errori di sistema di routine?

Microsoft Servizi online ottenere la resilienza del servizio tramite l'architettura ridondante, la replica dei dati e il controllo automatizzato dell'integrità. L'architettura ridondante prevede la distribuzione di più istanze di un servizio su hardware geograficamente e fisicamente separato, offrendo una maggiore tolleranza di errore per Microsoft Servizi online. La replica dei dati garantisce che siano sempre presenti più copie dei dati dei clienti in zone di errore diverse, consentendo il recupero dei dati critici dei clienti in caso di danneggiamento, perdita o eliminazione accidentale da parte del cliente. Il controllo automatico dell'integrità aumenta la disponibilità dei dati ripristinando automaticamente i dati interessati da molti tipi di danneggiamento fisico o logico.

I Servizi online Microsoft vengono controllati regolarmente per verificare la conformità alle normative e alle certificazioni esterne. Per la convalida dei controlli correlati alla resilienza e alla continuità, vedere la tabella seguente.

Azure e Dynamics 365

Controlli esterni Sezione Data report più recente
ISO 27001/27002

Dichiarazione di applicabilità
Certificato
A.17.1: Continuità della sicurezza delle informazioni
A.17.2: Ridondanze
6 novembre 2023
ISO 22301

Certificato
Tutti i controlli 24 aprile 2023
SOC 1
SOC 2
SOC 3
BC-1: Piani di continuità aziendale
BC-3: Procedure di continuità aziendale e ripristino di emergenza
BC-4: test BCDR
BC-7: Piani di continuità aziendale del data center
BC-8: Test di continuità aziendale del data center
BC-9: Valutazione della resilienza del data center
DS-5: Componenti del servizio chiavi di backup
DS-6: ridondanza dei componenti critici
DS-7: replica automatica dei dati dei clienti
DS-8: Pianificazione del backup
DS-9: Procedure di ripristino del backup
DS-11: backup fuori sede
DS-14: Ripristino automatico dei servizi clienti
17 novembre 2023

Microsoft 365

Controlli esterni Sezione Data report più recente
FedRAMP (Office 365) CP-2: Piano di emergenza
CP-3: Formazione di emergenza
CP-4: test del piano di emergenza
CP-6: sito di archiviazione alternativo
CP-7: sito di elaborazione alternativo
CP-9: Backup del sistema informativo
CP-10: Ripristino e ripristino del sistema informativo
31 luglio 2023
ISO 27001/27002

Dichiarazione di applicabilità
Certificato
A.17.1: Continuità della sicurezza delle informazioni
A.17.2: Ridondanze
Marzo 2024
ISO 22301
Certificato
Tutti i controlli Marzo 2024
SOC 1
SOC 2
CA-49: Criteri di backup
CA-50: Continuità aziendale
CA-51: Replica dei dati
23 gennaio 2024
SOC 3 CUEC-09: ripristino della posta elettronica EXO 23 gennaio 2024

Risorse