Проверка возможностей BCP

Завершено

Проверка возможностей является неотъемлемой частью жизненного цикла ERCM. Она включает тестирование эффективности плана непрерывности бизнес-процессов (BCP) в теории и на практике. Каждая группа обслуживания регулярно тестирует свою BCP, чтобы оценить эффективность плана и готовность команды обслуживания к выполнению плана. В соответствии с рекомендациями программы ERCM ежегодный обзор BCP и проверки возможностей должен быть проведен в течение 12 месяцев после последней проверки и включать в себя обзор вспомогательной документации, такой как BIA и DA.

этап проверки возможностей: – разработка сценариев; – проведение проверки; – документация результатов; – выявление недостатков и улучшений

Уровни проверки

Для проверки стратегий устойчивости и восстановления в случае широкого спектра потенциальных инцидентов программа ERCM определяет несколько категорий тестовых сценариев, затрагивающих людей, расположения и технологии. Отдельные группы обслуживания могут определять свои собственные тесты в соответствии с рекомендациями по сценариям тестирования ERCM.

Примеры тестовых сценариев:

  • Потеря основного здания или кластера кампуса
  • Технологические перерывы
  • Перебои в работе региональных сетей
  • Критические сторонние перерывы
  • Перерывы, связанные с рабочими ресурсами
  • Широкомасштабные региональные события
  • Потеря одного центра обработки данных
  • Кибератаки
  • Пандемия

В контексте каждого тестового сценария корпорация Майкрософт определяет восемь уровней проверки от 0 (означает, что возможность не протестирована) до 7 (возможность была полностью активирована во время тестирования). Уровни 1–4 тестируют функции плана непрерывности бизнес-процессов за пределами рабочих сред. Уровни 5–7 требуют более строгой проверки стратегий восстановления в рабочих средах, а уровень 7 требует проверки плана восстановления для всей экосистемы приложения, включая все зависимости. Уровень проверки, требуемый для каждой службы, зависит от ее важности. При этом более важные службы подвергаются более строгой проверке. Мы делаем результаты проверки возможностей для избранных веб-служб Майкрософт доступными для клиентов с помощью квартальных отчетов, доступных на портале service Trust Portal.

Реагирование на инциденты, затрагивающие службу

Значение проверки возможностей и непрерывного улучшения BCM становится очевидным, когда корпорации Майкрософт необходимо выполнять планы непрерывности бизнес-процессов для реагирования на инциденты, которые затрагивают службы. Когда ураган Харви обрушился на Техас и ожидался ущерб нашему центру обработки данных в Сан-Антонио, команда Exchange Online активировала план непрерывности бизнес-процессов, чтобы заблаговременно перевести трафик из центра обработки данных для предотвращения влияния на наших клиентов. Когда угроза миновала, центр обработки данных был возвращен в обычную работу без каких-либо инцидентов в соответствии с четко определенными процессами восстановления. Эти процессы внедрены благодаря тому, что команда Exchange Online обновила и протестировала свой план непрерывности на основе уроков, полученных из предыдущих стихийных бедствий, чтобы гарантировать эффективность плана во время реальных экстренных ситуаций.

Уроки, полученные на основе внутренних инцидентов, также поддерживают улучшения непрерывности бизнес-процессов. Когда в корпоративной сети Майкрософт возник сбой DNS из-за неудачного развертывания групповой политики, клиенты были защищены от любого воздействия, так как корпоративная сеть была изолирована от наших коммерческих служб в отдельных зонах сбоя. Однако это повлияло на внутреннюю коммуникацию в корпорации Майкрософт и затруднило координацию по устранению инцидента. Этот инцидент привел к созданию протоколов экстренных состояний для обеспечения взаимодействия между командами в корпорации Майкрософт во время инцидентов, которые влияют на внутреннюю коммуникацию.

Подробнее