Поделиться через


Непрерывность бизнес-процессов и аварийное восстановление

Платформа бизнес-приложений Microsoft (BAP) предоставляет возможности по обеспечению непрерывности бизнес-процессов и аварийного восстановления (BCDR) для всех сред производственного типа в Dynamics 365 и приложениях SAAS Power Platform. В этой статье описываются подробности и методы, которые Microsoft использует для обеспечения устойчивости ваших производственных данных во время региональных перебоев в работе.

Резервное копирование и репликация рабочих сред

Microsoft стремится обеспечить высочайший уровень доступности сервисов для ваших критически важных приложений и данных. Microsoft обеспечивает доступность базовой инфраструктуры и сервисов платформы с помощью своей архитектуры для непрерывности бизнеса и аварийного восстановления со следующими возможностями:

  • Реализация геоизбыточности, при которой для всех данных из рабочих сред (за исключением сред по умолчанию) создается резервная копия в парном/дополнительном регионе. Эти копии, называемые гео-дополнительными репликами, настраиваются во время развертывания основной среды.

  • Гео-дополнительные реплики синхронизируются с первичной средой посредством непрерывной репликации данных. Хотя в любой момент времени дополнительный регион может немного отставать от основного региона, по транзакциям данные в дополнительном регионе гарантированно согласованы с данными основного региона. Дополнительные сведения о георепликации см. на странице Активная георепликация — база данных Azure SQL.

Схема, иллюстрирующая гео-дополнительную реплику хранилища данных и вычислительной инфраструктуры.

На рисунке выше показано, что когда основной регион A оказывается затронут во время перебоя в работе, среды производственного типа из региона A переключаются на дополнительный регион B, который работоспособен. Для сред других типов, таких как среда по умолчанию, пробная среда, песочница, среда рабочих групп или среда разработчика, никаких действий не предпринимается.

Чтобы узнать больше о защите данных в непроизводственных средах, см. Резервное копирование и восстановление сред.

Как вы будете уведомляться о перебоях в работе?

 Основным каналом донесения информации является Панель мониторинга "Работоспособность служб" (SHD) в центрах администрирования Microsoft и Power Platform. Рабочая группа по связям с общественностью Microsoft начнет процесс, разместив первоначальные сообщения, чтобы уведомить вас о перебое в работе, и по мере необходимости будет актуализировать информацию в SHD. Дополнительную информацию о том, как просматривать сообщения в центре администрирования, см. в разделе Главная страница панели мониторинга. Чтобы лучше подготовиться, посетите страницу готовности.    

Процессы отработки отказа и восстановления после отказа и критерии непрерывности бизнеса

Отработка отказа и восстановление после отказа — две основные задачи, выполняемые в процессе обеспечения непрерывности бизнес-процессов и аварийного восстановления (BCDR). Их цель состоит в том, чтобы минимизировать влияние аварии на доступность и производительность критически важных бизнес-функций и приложений.

Отработка отказа — это процесс переключения на назначенную гео-дополнительную реплику всех систем и данных вашего основного производственного местонахождения. По завершении операции отработки отказа ваша рабочая среда будет доступна в гео-дополнительном местонахождении.

Важно

Пока приложения для управления финансами и операциями работают в дополнительном регионе после отработки отказа, развертывание пакетов, Financial Reporting и отчеты Power BI недоступны.

Операция восстановления после отказа — это процесс возврата производства в исходное местонахождение после аварии или завершения запланированного обслуживания.

В рамках принятого в Microsoft стандарта непрерывности бизнес-процессов и аварийного восстановления (BCDR) каждый онлайн-сервис Microsoft в обязательном порядке ежегодно проверяет, тестирует и обновляет свой план BCDR. Отчет проверки плана непрерывности бизнес-процессов и аварийного восстановления Microsoft Cloud доступен клиентам в Service Trust Portal.

В случае непредвиденного перебоя в работе в масштабах всего региона, например, если стихийное бедствие затронет весь регион Azure, будет предпринята приведенная ниже последовательность шагов и процессов.

Ответственность Microsoft Ответственность клиентов
Если Microsoft обнаружит перебой в работе и увидит, что это затронуло клиентов, рабочая группа Microsoft по связям с общественностью разошлет необходимые сообщения и будет актуализировать необходимую информацию на панели мониторинга работоспособности служб. None
В случае перебоя в работе Microsoft в рамках процедуры отработки отказа автоматически переводит производственные экземпляры в дополнительный регион, если это НЕ ПРИВЕДЕТ К ПОТЕРЕ ДАННЫХ клиента. None
Если в случае перебоя в работе Microsoft определяет, что произошла ПОТЕРЯ ДАННЫХ, переключение среды в рамках отработки отказа не инициируется без согласия/одобрения клиента. Узнав о текущем перебое в работе и увидев его ПОСЛЕДСТВИЯ, клиент обязан:
- Связаться с Microsoft через службу поддержки и выяснить степень потери данных, которая произойдет в случае инициирования отработки отказа.
- Если потеря данных будет приемлемой по стандартам организации, то клиент должен выразить свое согласие через службу поддержки, чтобы Microsoft инициировала отработку отказа.
Когда Microsoft определяет, что основной регион снова работает и полностью работоспособен, для производственных экземпляров выполняется ВОССТАНОВЛЕНИЕ ПОСЛЕ СБОЯ. Во время запланированного процесса восстановления после сбоя не происходит потери данных, но пользователи могут испытывать кратковременные перебои или отключения в течение этого периода. None