Архитектура аварийного восстановления из VMware в Azure — классическая модель

В этой статье описаны архитектура и процессы, используемые при развертывании репликации для аварийного восстановления, отработки отказов и восстановления виртуальных машин VMware между локальным сайтом VMware и Azure с помощью службы Azure Site Recovery — классическая модель.

Дополнительные сведения об модернизации архитектуры см. в этой статье

Компоненты архитектуры

Приведенные ниже таблица и рисунки позволяют получить общее представление о компонентах, используемых для аварийного восстановления виртуальных/физических машин VMware в Azure.

Компонент Требование Подробности
Azure Подписка Azure, учетная запись хранения Azure для кэша, управляемый диск и сеть Azure. Реплицированные данные из локальных виртуальных машин хранятся в учетной записи хранения. Виртуальные машины Azure создаются с использованием реплицированных данных при запуске отработки отказа из локальной среды в Azure. При создании виртуальные машины Azure подключаются к виртуальной сети Azure.
Компьютер сервера конфигурации Отдельный локальный компьютер. Мы рекомендуем использовать виртуальную машину VMware, которую можно развернуть с помощью скачанного шаблона в формате OVF.

На этой машине выполняются все локальные компоненты Site Recovery, включая сервер конфигурации, сервер обработки и главный целевой сервер.
Сервер конфигурации используется для управления обменом данными между локальной средой и Azure, а также репликацией данных.

Сервер обработки по умолчанию устанавливается на сервере конфигурации. Он получает данные репликации, оптимизирует их путем кэширования, сжатия и шифрования и отправляет эти данные в службу хранилища Azure. Сервер обработки также устанавливает службу Mobility Service Azure Site Recovery на виртуальные машины, которые требуется реплицировать, и выполняет автоматическое обнаружение локальных компьютеров. По мере увеличения масштаба развертывания вы можете добавлять дополнительные отдельные серверы для обработки растущего объема данных репликации.

Главный целевой сервер по умолчанию устанавливается на сервере конфигурации. Он обрабатывает данные репликации при восстановлении размещения из Azure. Для крупных развертываний вы можете добавить отдельный главный целевой сервер для восстановления размещения.
Серверы VMware Виртуальные машины VMware размещаются на локальных серверах vSphere ESXi. Мы рекомендуем управлять узлами с помощью сервера vCenter. При развертывании Site Recovery добавьте серверы VMware в хранилище служб восстановления.
Реплицируемые компьютеры Служба Mobility Service устанавливается на каждой реплицируемой виртуальной машине VMware. Рекомендуем разрешить автоматическую установку с сервера обработки. Кроме того, вы можете установить службу вручную или использовать средство автоматического развертывания, такое как System Center Configuration Manager.

Diagram showing VMware to Azure replication architecture relationships.

Настройка исходящих сетевых подключений

Чтобы служба Site Recovery работала должным образом, необходимо модифицировать исходящее сетевое подключение, так, чтобы оно позволило вашей среде делать репликацию.

Примечание.

Восстановление сайта VMware или Physical, использующих классическую архитектуру, не поддерживает использование прокси-сервера проверки подлинности для управления сетевым подключением. То же самое поддерживается при использовании модернизированной архитектуры.

Исходящие подключения для URL-адресов

При использовании прокси-сервера или брандмауэра на основе URL-адресов для управления исходящими подключениями разрешите использование этих URL-адресов:

Название Коммерческие организации Государственный сектор Description
Хранилище *.blob.core.windows.net *.blob.core.usgovcloudapi.net Позволяет записывать данные из виртуальной машины в учетную запись хранения кэша в исходном регионе.
ИД Microsoft Entra login.microsoftonline.com login.microsoftonline.us Обеспечивает авторизацию и проверку подлинности URL-адресов службы Site Recovery.
Репликация *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us Позволяет виртуальной машине взаимодействовать со службой Site Recovery.
Cлужебная шина *.servicebus.windows.net *.servicebus.usgovcloudapi.net Позволяет виртуальной машине записывать данные мониторинга и диагностики службы Site Recovery.

Полный список URL-адресов, которые должны быть отфильтрованы для обмена данными между локальной инфраструктурой Azure Site Recovery и службами Azure, см. в статьеТребования к сети, раздел "Предварительные условия".

Процесс репликации

  1. При включении репликации для виртуальной машины начинается начальная репликация в службу хранилища Azure с помощью указанной политики репликации. Обратите внимание на следующее:

    • Для виртуальных машин VMware репликации осуществляются на уровне блока почти непрерывно с помощью агента Mobility Service на виртуальной машине.
    • Применяются все параметры политики реплика.
      • Пороговое значение RPO. Этот параметр не влияет на репликацию. Он помогает с мониторингом. Будет создано событие, возможно, с отправкой сообщения электронной почты, если текущее значение RPO превышает заданное вами пороговое значение.
      • Хранение точки восстановления. Этот параметр указывает, на какой период в прошлом вы хотите вернуться в случае нарушения работы. Максимальный срок хранения данных на управляемом диске составляет 15 дней.
      • Согласованные с приложением моментальные снимки. Моментальный снимок, согласованный с приложением, может создаваться с интервалом от 1 до 12 часов в зависимости от потребностей приложения. Это стандартные моментальные снимки BLOB-объектов Azure. Агент службы Mobility, запущенный на виртуальной машине, запрашивает моментальный снимок VSS в соответствии с этим параметром и отмечает этот момент времени как точку согласованности приложения в потоке репликации.

      Примечание.

      Большой период хранения точки восстановления может повлиять на стоимость хранения, так как может потребоваться сохранить дополнительные точки восстановления.

  2. Трафик реплицируется в общедоступные конечные точки службы хранилища Azure через Интернет. Кроме того, можно использовать Azure ExpressRoute со службой Пиринг Microsoft . Репликация трафика через VPN типа "сеть — сеть" с локального сайта в Azure не поддерживается.

  3. Начальная репликация обеспечивает, чтобы все данные на компьютере во время включения репликации отправлялись в Azure. После завершения начальной репликации начинается репликация разностных изменений в Azure. Отслеживаемые изменения для машины отправляются на сервер обработки.

  4. Обмен данными происходит следующим образом.

    • Виртуальные машины обмениваются данными с локальным сервером конфигурации через HTTPS-порт 443 для входящих подключений, чтобы управлять репликацией.
    • Сервер конфигурации выполняет оркестрацию репликации в Azure через HTTPS-порт 443 для исходящих подключений.
    • Виртуальные машины отправляют данные репликации на сервер обработки (запущенный на компьютере сервера конфигурации) через HTTPS-порт 9443 для входящих подключений. Этот порт можно изменить.
    • Сервер обработки получает данные репликации, оптимизирует и шифрует их, а затем отправляет в службу хранилища Azure через порт 443 для исходящих подключений.
  5. Сначала журналы данных репликации помещаются в учетную запись хранения кэша в Azure. Эти журналы обрабатываются, а данные сохраняются на управляемом диске Azure (называемом начальным диском Azure Site Recovery). На этом диске создаются точки восстановления.

Diagram showing the VMware to Azure replication process.

Процедура повторной синхронизации

  1. Иногда во время начальной репликации или при передаче разностных изменений могут возникнуть проблемы с сетевым подключением между исходным компьютером и сервером обработки или между сервером обработки и Azure. Любая из них может привести к сбоям при мгновенной передаче данных в Azure.
  2. Чтобы избежать проблем с целостностью данных и снизить затраты на их передачу, Site Recovery помечает компьютер для повторной синхронизации.
  3. Компьютер также можно пометить для повторной синхронизации в таких ситуациях, как показано ниже, чтобы обеспечить согласованность между исходным компьютером и данными, хранящимися в Azure.
    • Если компьютер попадает под принудительное завершение работы
    • Если компьютер проходит процесс изменения в конфигурации, например изменение размера диска (размер диска изменяется с 2 ТБ на 4 ТБ)
  4. Повторная синхронизация отправляет в Azure только разностные данные. Обмен данными между локальной средой и Azure путем сворачивания контрольных сумм данных между исходным компьютером и данными, хранящимися в Azure.
  5. По умолчанию повторная синхронизация автоматически выполняется в нерабочее время. Если вы не хотите ждать времени повторной синхронизации по умолчанию, то можете повторно синхронизировать виртуальную машину вручную. Для этого на портале Azure выберите виртуальную машину и щелкните >Повторная синхронизация.
  6. Если повторная синхронизация, установленная по умолчанию, завершается сбоем в нерабочее время и требуется вмешательство вручную, то на определенном компьютере в портале Azure возникает ошибка. Вы можете устранить эту ошибку и запустить повторную синхронизацию вручную.
  7. После завершения повторной синхронизации будет возобновлена репликация разностных изменений.

Управление политиками репликации

  • Вы можете настроить параметры политик репликации при включении репликации.
  • Можно в любой момент создать политику репликации и применить ее при включении репликации.

Согласованность нескольких виртуальных машин

Если вы хотите, чтобы несколько виртуальных машин реплицировались вместе и для них создавались отказоустойчивые и согласованные на уровне приложений точки восстановления для отработки отказа, объедините такие машины в группу репликации. Согласованность нескольких виртуальных машин влияет на производительность рабочей нагрузки, и ее следует применять только для виртуальных машин, на которых требуется согласованность рабочих нагрузок между всеми компьютерами.

Моментальные снимки и точки восстановления

Точки восстановления создаются на основе моментальных снимков дисков виртуальной машины, сделанных в определенный момент времени. При отработке отказа виртуальной машины эти точки восстановления используются для восстановления виртуальной машины в целевом расположении.

Обычно при отработке отказа важно, чтобы виртуальная машина запускалась без повреждения или потери данных и чтобы данные на этой виртуальной машине сохраняли согласованность на уровне операционной системы и выполняемых приложений. Это зависит от типа создаваемых моментальных снимков.

Site Recovery создает моментальные снимки следующим образом.

  1. Site Recovery по умолчанию создает моментальные снимки данных без учета состояния приложений, а также моментальные снимки, согласованные на уровне приложений, если вы укажете для них частоту создания.
  2. Точки восстановления создаются на основе моментальных снимков и сохраняются в соответствии с параметрами хранения, указанными в политике репликации.

Согласованность

В следующей таблице описываются различные виды согласованности.

Без учета состояния приложений

Description Подробности Рекомендация
Моментальный снимок без учета состояния приложения содержит все данные, которые были записаны на диск в момент создания этого моментального снимка. Он не содержит никакой информации из памяти компьютера.

Он сохраняет данные точно так же, как если бы в момент создания моментального снимка произошел сбой виртуальной машины или отключение питания сервера.

Моментальный снимок без учета состояния не гарантирует согласованность данных для операционной системы или приложений этой виртуальной машины.
По умолчанию Site Recovery создает точки восстановления без учета состояния приложений каждые пять минут. Этот параметр нельзя изменять.

Сейчас большинство приложений успешно восстанавливаются по точкам восстановления без учета состояния.

Точек восстановления без учета состояния приложений обычно вполне достаточно для репликации операционных систем и приложений, таких как DHCP-серверы и серверы печати.

согласованность на уровне приложений

Description Подробности Рекомендация
Точки восстановления с согласованностью на уровне приложений создаются на основе моментальных снимков с согласованностью на уровне приложений.

Моментальные снимки с согласованностью на уровне приложений содержат все сведения, включаемые в моментальный снимок без учета состояния приложений, а также все данные в памяти и незаконченные транзакции.
Моментальные снимки с согласованностью на уровне приложений создаются с помощью службы теневого копирования томов (VSS).

1) Azure Site Recovery использует метод резервного копирования "только копирование" (VSS_BT_COPY). Он не изменяет время резервного копирования и порядковый номер в журнале транзакций Microsoft SQL.

2) При инициации создания моментального снимка VSS выполняет с томом операцию копирования при записи (COW).

3) Перед этой операцией VSS сообщает каждому приложению на компьютере, что все данные из оперативной памяти необходимо передать на диск.

4) VSS предоставляет приложению резервного копирования и аварийного восстановления (в нашем примере это Site Recovery) возможность считать данные моментального снимка и продолжить работу.
Вы можете указать частоту создания моментальных снимков с согласованностью на уровне приложений. Эта частота должна быть меньше, чем период хранения точек восстановления. Например, если для хранения точек восстановления используется значение по умолчанию 24 часа, настройте частоту создания с интервалом менее 24 часов.

Такие моментальные снимки более сложны и требуют больше времени на создание, чем моментальные снимки без учета состояния приложений.

Они снижают производительность приложений, которые выполняются на реплицируемой виртуальной машине.

Процесс отработки отказа и восстановления размещения

Настроив репликацию и выполнив отработку аварийного восстановления (тестовую отработку отказа), чтобы проверить правильность работы всех компонентов, вы можете запускать отработку отказа и восстановление размещения по мере необходимости.

  1. Можно выполнять отработку отказа отдельных компьютеров или создать планы восстановления, чтобы выполнять отработку отказа сразу нескольких виртуальных машин. План восстановления имеет следующие преимущества перед отработкой отказа отельных компьютеров:

    • Можно моделировать зависимости приложений, включив все виртуальные машины для приложения в один план восстановления.
    • Можно добавить сценарии, модули runbook Azure и паузу для действий, выполняемых вручную.
  2. После активации начальной отработки отказа выполняется ее фиксация для получения доступа к рабочей нагрузке из виртуальной машины Azure.

  3. Когда основной локальный сайт снова станет доступным, можно будет подготовить среду к восстановлению размещения. Для восстановления размещения следует настроить инфраструктуру восстановления размещения, включая следующее:

    • Временный сервер обработки в Azure. Чтобы восстановить размещение из Azure, настройте виртуальную машину Azure как сервер обработки. Это позволит выполнять репликацию из Azure. После восстановления размещения эту виртуальную машину можно удалить.
    • VPN-подключение. Для восстановления размещения нужно настроить VPN-подключение (или ExpressRoute) между сетью Azure и локальным сайтом.
    • Отдельный главный целевой сервер. По умолчанию главный целевой сервер, установленный вместе с сервером конфигурации на локальной виртуальной машине VMware, обрабатывает восстановление размещения. Чтобы восстановить размещение больших объемов трафика,отдельно настройте локальный главный целевой сервер.
    • Политика восстановления размещения. Для репликации обратно на локальный сайт необходима политика восстановления размещения. Эта политика создается автоматически при создании политики репликации из локальной среды в Azure.
  4. После готовности всех компонентов восстановление размещения выполняется в три этапа:

    • Этап 1. Повторно включите защиту виртуальных машин Azure, чтобы обеспечить их репликацию из Azure в локальные виртуальные машины VMware.
    • Этап 2. Запустите отработку отказа на локальном сайте.
    • Этап 3. После восстановления размещения рабочих нагрузок повторно включите репликацию для локальных виртуальных машин.

Diagram showing VMware failback from Azure.

Следующие шаги

Ознакомьтесь с этим учебником, чтобы включить репликацию из VMware в Azure.