Поделиться через


Архитектура аварийного восстановления из Azure в Azure

В этой статье описывается архитектура, компоненты и процессы, используемые при развертывании аварийного восстановления для виртуальных машин Azure на основе службы Azure Site Recovery. При установке аварийного восстановления виртуальные машины Azure непрерывно реплицируются в другой целевой регион. В случае сбоя вы сможете выполнить для таких виртуальных машин отработку отказа в дополнительный регион и получать доступ к ним в этом регионе. Когда нормальная работа возобновится, можно восстановить исходное размещение и продолжить работу в основном расположении.

Компоненты архитектуры

В следующей таблице перечислены компоненты, участвующие в аварийном восстановлении виртуальных машин Azure.

Компонент Требования
Виртуальные машины в исходном регионе Одна или несколько виртуальных машин Azure в поддерживаемом исходном регионе.

Виртуальные машины могут работать под управлением любой поддерживаемой операционной системы.
Хранилище исходной виртуальной машины Виртуальные машины Azure можно управлять или иметь неуправляемые диски, распределенные по учетным записям хранения.

См. дополнительные сведения о поддерживаемых хранилищах Azure.
Сети исходных виртуальных машин Виртуальные машины могут размещаться в одной или нескольких подсетях виртуальной сети в исходном регионе. См. дополнительные сведения о требованиях к сети.
Учетная запись хранения кэша Вам нужна учетная запись хранения кэша в исходной сети. В процессе репликации все изменения виртуальной машины сначала сохраняются в кэше, а затем отправляются в целевое хранилище.

Использование кэша сводит к минимуму влияние на рабочие приложения, запущенные на виртуальной машине.

См. дополнительные сведения о требованиях к хранилищу кэша.
Целевые ресурсы Целевые ресурсы используются во время репликации и при отработке отказа. Site Recovery может назначить целевой ресурс по умолчанию, или вы можете создать и настроить ресурсы самостоятельно.

В целевом регионе убедитесь, что вы можете создавать виртуальные машины, и что у вашей подписки достаточно ресурсов для поддержки размеров виртуальных машин, необходимых в целевом регионе.

Схема, на которой показана исходная и целевая репликации.

Целевые ресурсы

Когда вы включаете репликацию для виртуальной машины, Site Recovery предоставляет возможность автоматически создать целевые ресурсы.

Целевой ресурс Значение по умолчанию
Целевая подписка Совпадает с исходной подпиской.
Целевая группа ресурсов Группа ресурсов, в которой размещаются виртуальные машины после отработки отказа.

Она может располагаться в любом регионе, за исключением исходного.

Site Recovery создает в целевом регионе новую группу ресурсов с суффиксом asr.
Целевая виртуальная сеть Виртуальная сеть, в которой реплицированные виртуальные машины будут находиться после отработки отказа. Сетевое сопоставление создается между исходными и целевыми виртуальными сетями и наоборот.

Site Recovery создает новую виртуальную сеть и подсеть с суффиксом asr.
Целевая учетная запись хранения Если виртуальная машина не использует управляемый диск, данные реплицируются в эту учетную запись хранения.

Site Recovery создает в целевом регионе новую учетную запись хранения, которая будет зеркальной копией исходной учетной записи хранения.
Управляемые диски реплики Если виртуальная машина использует управляемый диск, данные реплицируются на эти управляемые диски.

Site Recovery создает в регионе хранения управляемые диски реплики, которые будут зеркальной копией исходных.
Целевая группа доступности Группа доступности, в которой размещаются реплицированные виртуальные машины после отработки отказа.

Site Recovery создает в целевом регионе группу доступности с суффиксом asr для размещения виртуальных машин, включенных в группу доступности в исходном расположении. Если группа доступности уже существует, используется именно она, а новая не создается.
Целевые зоны доступности Если целевой регион поддерживает зоны доступности, Site Recovery назначает в нем тот же номер зоны, что и в исходном регионе.

Управление целевыми ресурсами

Вы можете управлять целевыми ресурсами следующим образом.

  • Можно изменять параметры целевого объекта при включении репликации. Обратите внимание, что номер SKU по умолчанию для виртуальной машины целевого региона совпадает с номером SKU исходной виртуальной машины (или следующим лучшим доступным номером SKU для исходной виртуальной машины). В раскрывающемся списке показаны только номера SKU того же семейства, что и исходная виртуальная машина (1-го или 2-го поколения).
  • Можно изменять параметры целевого объекта, когда репликация уже работает. Аналогично другим ресурсам, таким как целевая группа ресурсов, целевое имя и другие, номер SKU виртуальной машины целевого региона можно также обновить после выполнения репликации. Ресурс, который не может быть обновлен, является типом доступности (один экземпляр, набор или зона). Чтобы изменить этот параметр, придется отключить репликацию и повторно включить ее после изменения параметра.

Политика репликации

По умолчанию при включении репликации виртуальной машины Azure служба Site Recovery создает политику репликации, стандартные параметры которой представлены в таблице.

Параметр политики Сведения По умолчанию
Хранение точки восстановления Указывает, как долго в Site Recovery хранятся точки восстановления. Один день
Периодичность создания моментальных снимков с согласованием приложений Определяет, как часто Site Recovery создает моментальные снимки с согласованностью на уровне приложений. Ноль часов (отключено)

Управление политиками репликации

Вы можете изменить заданные по умолчанию параметры политик репликации и управлять ими следующим образом:

  • Можно изменять параметры при включении репликации.
  • Можно в любой момент создать политику репликации и применить ее при включении репликации.

Примечание.

Большой период хранения точки восстановления может повлиять на стоимость хранения, так как может потребоваться сохранить дополнительные точки восстановления.

Согласованность нескольких виртуальных машин

Если вы хотите, чтобы несколько виртуальных машин реплицировались вместе и для них создавались отказоустойчивые и согласованные на уровне приложений точки восстановления для отработки отказа, объедините такие машины в группу репликации. Согласованность нескольких виртуальных машин влияет на производительность рабочей нагрузки, и ее следует применять только для виртуальных машин, на которых требуется согласованность рабочих нагрузок между всеми компьютерами.

Моментальные снимки и точки восстановления

Точки восстановления создаются на основе моментальных снимков дисков виртуальной машины, сделанных в определенный момент времени. При отработке отказа виртуальной машины эти точки восстановления используются для восстановления виртуальной машины в целевом расположении.

Обычно при отработке отказа важно, чтобы виртуальная машина запускалась без повреждения или потери данных и чтобы данные на этой виртуальной машине сохраняли согласованность на уровне операционной системы и выполняемых приложений. Это зависит от типа создаваемых моментальных снимков.

Site Recovery создает моментальные снимки следующим образом.

  1. Site Recovery по умолчанию создает моментальные снимки данных без учета состояния приложений, а также моментальные снимки, согласованные на уровне приложений, если вы укажете для них частоту создания.
  2. Точки восстановления создаются на основе моментальных снимков и сохраняются в соответствии с параметрами хранения, указанными в политике репликации.

Согласованность

В следующей таблице описываются различные виды согласованности.

Без учета состояния приложений

Description Сведения Рекомендация
Моментальный снимок без учета состояния приложения содержит все данные, которые были записаны на диск в момент создания этого моментального снимка. Он не содержит никакой информации из памяти компьютера.

Он сохраняет данные точно так же, как если бы в момент создания моментального снимка произошел сбой виртуальной машины или отключение питания сервера.

Моментальный снимок без учета состояния не гарантирует согласованность данных для операционной системы или приложений этой виртуальной машины.
По умолчанию Site Recovery создает точки восстановления без учета состояния приложений каждые пять минут. Этот параметр нельзя изменять.

Сейчас большинство приложений успешно восстанавливаются по точкам восстановления без учета состояния.

Для репликации операционных систем достаточно точек восстановления, согласованных с сбоями, и приложений, таких как DHCP-серверы и серверы печати.

согласованность на уровне приложений

Description Сведения Рекомендация
Точки восстановления с согласованностью на уровне приложений создаются на основе моментальных снимков с согласованностью на уровне приложений.

Моментальный снимок, согласованный с приложением, содержит все сведения в моментальном снимке, а также все данные в памяти и транзакциях.
Моментальные снимки с согласованностью на уровне приложений создаются с помощью службы теневого копирования томов (VSS).

1) Azure Site Recovery использует метод резервного копирования только копирования (VSS_BT_COPY), который не изменяет время резервного копирования журнала транзакций Microsoft SQL и номер последовательности

2). При запуске моментального снимка VSS выполняет операцию копирования по записи (COW) на томе.

3) Перед этой операцией VSS сообщает каждому приложению на компьютере, что все данные из оперативной памяти необходимо передать на диск.

4) VSS предоставляет приложению резервного копирования и аварийного восстановления (в нашем примере это Site Recovery) возможность считать данные моментального снимка и продолжить работу.
Вы можете указать частоту создания моментальных снимков с согласованностью на уровне приложений. Эта частота должна быть меньше, чем период хранения точек восстановления. Например, если для хранения точек восстановления используется значение по умолчанию 24 часа, настройте частоту создания с интервалом менее 24 часов.

Такие моментальные снимки более сложны и требуют больше времени на создание, чем моментальные снимки без учета состояния приложений.

Они снижают производительность приложений, которые выполняются на реплицируемой виртуальной машине.

Процесс репликации

При включении репликации для виртуальной машины Azure происходит следующее.

  1. На виртуальной машине автоматически устанавливается расширение службы мобильности Site Recovery.
  2. Это расширение регистрирует виртуальную машину в Site Recovery.
  3. Для виртуальной машины начинается постоянная репликация. Все операции записи данных немедленно передаются в учетную запись хранения кэша в исходном расположении.
  4. Site Recovery обрабатывает данные кэша и отправляет их в целевую учетную запись хранения или на управляемые диски реплики.
  5. По результатам обработки этих данных каждые пять минут создаются отказоустойчивые точки восстановления. Точки восстановления с согласованностью на уровне приложений создаются в соответствии с параметром, указанным в политике репликации.

Схема, показывающая процесс репликации, шаг 2.

Процесс репликации

Требования к подключению

Реплицируемая виртуальная машина Azure должна иметь возможность исходящего подключения. Для Site Recovery никогда не требуется входящее подключение к виртуальной машине.

Исходящие подключения для URL-адресов

Если виртуальной машине разрешен исходящий доступ только к определенным URL-адресам, включите в этот список следующие URL-адреса.

Имя Коммерческие организации Государственный сектор Description
Хранилище *.blob.core.windows.net *.blob.core.usgovcloudapi.net Позволяет записывать данные из виртуальной машины в учетную запись хранения кэша в исходном регионе.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Обеспечивает авторизацию и проверку подлинности URL-адресов службы Site Recovery.
Репликация *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us Позволяет виртуальной машине взаимодействовать со службой Site Recovery.
Cлужебная шина *.servicebus.windows.net *.servicebus.usgovcloudapi.net Позволяет виртуальной машине записывать данные мониторинга и диагностики службы Site Recovery.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net Разрешает доступ для включения репликации для виртуальных машин с поддержкой ADE через портал
Azure Automation *.automation.ext.azure.com *.azure-automation.us Позволяет включить автоматическое обновление агента мобильности для реплицированного элемента с помощью портала

Исходящие подключения для диапазонов IP-адресов

Если управление исходящими подключениями виртуальной машины настроено по IP-адресам, разрешите следующие адреса. Обратите внимание, что подробные сведения о требованиях к сетевому подключению можно найти в техническом документе сети.

Правила исходного региона

Правило Сведения Тег службы
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие учетным записям хранения в исходном регионе. Storage.<имя_региона>
Allow HTTPS outbound: port 443 Разрешить диапазоны, соответствующие идентификатору Microsoft Entra AzureActiveDirectory
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие концентратору событий в целевом регионе. EventHub.<имя-региона>
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие службе Azure Site Recovery. AzureSiteRecovery
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие Azure Key Vault (это необходимо только для включения репликации виртуальных машин с поддержкой ADE через портал). AzureKeyVault
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие контроллеру службы автоматизации Azure (это требуется только для включения автоматического обновления агента мобильности для реплицируемого элемента с помощью портала). GuestAndHybridManagement

Правила целевого региона

Правило Сведения Тег службы
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие учетным записям хранения в целевом регионе. Storage.<имя_региона>
Allow HTTPS outbound: port 443 Разрешить диапазоны, соответствующие идентификатору Microsoft Entra AzureActiveDirectory
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие концентратору событий в исходном регионе. EventHub.<имя-региона>
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие службе Azure Site Recovery. AzureSiteRecovery
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие Azure Key Vault (это необходимо только для включения репликации виртуальных машин с поддержкой ADE через портал). AzureKeyVault
Allow HTTPS outbound: port 443 Разрешает диапазоны, соответствующие контроллеру службы автоматизации Azure (это требуется только для включения автоматического обновления агента мобильности для реплицируемого элемента с помощью портала). GuestAndHybridManagement

Управление доступом с помощью правил группы безопасности сети

Если вы управляете подключением к виртуальной машине путем фильтрации сетевого трафика в сети и из сетей Azure с помощью правил группы безопасности сети, обратите внимание на следующие требования:

  • Правила группы безопасности сети для исходного региона Azure должны разрешать исходящий доступ к трафику репликации.
  • Мы рекомендуем создать правила в тестовой среде, прежде чем применять их к рабочей среде.
  • Используйте теги служб вместо конкретных отдельных IP-адресов.
    • Теги служб обозначают группы префиксов IP-адресов, что позволяет упростить создание правил безопасности.
    • Корпорация Майкрософт автоматически обновляет теги служб по мере необходимости.

Узнайте больше о исходящем подключении для Site Recovery и управлении подключением к группам безопасности сети.

Подключения для согласованности между виртуальными машинами

Если включить согласованность между виртуальными машинами, компьютеры в группе репликации будут обмениваться данными друг с другом через порт 20004.

  • Убедитесь, что устройство брандмауэра не блокирует внутреннюю связь между виртуальными машинами через порт 20004.
  • Если вы хотите, чтобы виртуальные машины Linux входили в группу репликации, нужно вручную открыть исходящий трафик через порт 20004 согласно указаниям для конкретной версии Linux.

Процесс отработки отказа

При запуске отработки отказа виртуальные машины создаются в целевой группе ресурсов, целевой виртуальной сети, целевой подсети и целевой группе доступности. Во время отработки отказа можно использовать любую точку восстановления.

Схема, показывающая процесс отработки отказа с исходной и целевой средой.

Следующие шаги