Планирование ресурсов и масштабирования для аварийного восстановления из VMware в Azure

Используйте данную статью, чтобы выяснить, как планировать емкость и масштабирование при репликации локальных физических серверов и виртуальных машин VMware в Azure с помощью классической версии Azure Site Recovery.

В модернизированном режиме необходимо создать и использовать устройство репликации azure Site Recovery или несколько устройств для планирования емкости.

С чего начать планирование загрузки?

Чтобы получить представление о требованиях инфраструктуры Azure Site Recovery, соберите сведения о среде репликации, запустив Планировщик развертывания Azure Site Recovery для репликации VMware. Дополнительные сведения см. в статье О Планировщике развертывания Azure Site Recovery для восстановления виртуальных машин VMware в Azure.

Планировщик развертывания Site Recovery создает отчет с полными сведениями о виртуальных машинах (совместимых и несовместимых), дисках на каждой виртуальной машине и обновлениях данных на каждом диске. Средство также собирает данные о требованиях к пропускной способности сети для соответствия целевым значениям RPO и инфраструктуре Azure для успешной репликации и тестовой отработки отказа.

Рекомендации по емкости

Компонент Сведения
Репликация Максимальный объем ежедневных изменений. Защищенный компьютер может использовать только один сервер обработки. Один сервер обработки может поддерживать скорость ежедневного изменения до 2 ТБ. Таким образом, 2 ТБ — это максимально допустимый объем ежедневных изменений данных на защищенном компьютере.

Максимальная пропускная способность. Реплицированный компьютер может принадлежать только к одной учетной записи хранения Azure. Стандартная учетная запись хранения Azure может обрабатывать не более 20 000 запросов в секунду. Мы рекомендуем не превышать количество в 20 000 операций ввода-вывода в секунду на исходном компьютере. Например, если исходный компьютер содержит 5 дисков, на каждом из которых выполняется по 120 операций ввода-вывода в секунду (размером в 8 КБ), то этот компьютер не будет превышать ограничение в 500 операций ввода-вывода в секунду на диск в Azure. (Число необходимых учетных записей хранения определяется путем деления общего числа операций ввода-вывода для исходного компьютера на 20 000).
Сервер конфигурации Сервер конфигурации должен поддерживать суммарный объем ежедневно изменяемых данных для всех рабочих нагрузок, которые выполняются на защищенных компьютерах. Компьютер конфигурации должен обладать достаточной пропускной способностью для непрерывной репликации данных в службу хранилища Azure.

Мы рекомендуем разместить сервер конфигурации в той же сети и в том же сегменте локальной сети, что и компьютеры, которые необходимо защитить. Его можно разместить и в другой сети при наличии у компьютеров, которые нужно защитить, видимости сети третьего уровня.

В следующем разделе в таблице приведены рекомендации по размерам для сервера конфигурации.
Сервер обработки Первый сервер обработки по умолчанию устанавливается на сервере конфигурации. Для масштабирования среды можно развернуть дополнительные серверы обработки.

Сервер обработки получает данные репликации от защищенных компьютеров. Сервер обработки оптимизирует данные репликации с помощью кэширования, сжатия и шифрования. Затем сервер обработки отправляет данные в Azure. Сервер обработки должен располагать достаточными ресурсами для выполнения этих задач.

Сервер обработки использует дисковый кэш. Чтобы обеспечить обработку хранящихся изменений данных в случае возникновения узкого места в сети или сбоя, установите отдельный диск кэша объемом 600 ГБ или более.

Рекомендации по выбору размера сервера конфигурации и встроенного сервера обработки

Сервер конфигурации, в котором сервер обработки используется для защиты рабочей нагрузки, может обрабатывать до 200 виртуальных машин на основе следующих конфигураций.

ЦП Память Размер диска кэша Частота изменения данных Защищаемые компьютеры
8 виртуальных ЦП (2 сокета * 4 ядра с частотой 2,5 ГГц) 16 Гб 300 ГБ 500 ГБ или менее Репликация не более 100 компьютеров.
12 виртуальных ЦП (2 сокета * 6 ядер с частотой 2,5 ГГц) 18 ГБ 600 ГБ От 501 ГБ до 1 ТБ Репликация 100–150 компьютеров.
16 виртуальных ЦП (2 сокета * 8 ядер с частотой 2,5 ГГц) 32 Гб 1 TБ >От 1 ТБ до 2 ТБ Репликация 151–200 компьютеров.
Развертывание дополнительного сервера конфигурации с помощью шаблона OVF. Если вы выполняете репликацию более 200 компьютеров, разверните новый сервер конфигурации.
Развертывание дополнительного сервера обработки. >2 ТБ Если общий объем ежедневно изменяемых данных превышает 2 ТБ, разверните новый сервер обработки масштабирования.

В этих конфигурациях:

  • каждый исходный компьютер содержит три диска объемом 100 ГБ каждый;
  • чтобы измерить показатели диска кэша, мы использовали хранилище для тестирования производительности восьми дисков SAS с частотой вращения шпинделя 10 000 об/мин в конфигурации RAID 10.

Рекомендации по размеру сервера обработки

Сервер обработки — это компонент, который обрабатывает данные репликации в Azure Site Recovery. Если объем ежедневно изменяемых данных составляет более 2 ТБ, для обработки такой нагрузки репликации нужно добавить серверы обработки масштабирования. Для развертывания можно выполнить следующее.

  • Увеличить число серверов конфигурации, выполнив развертывание с помощью шаблона OVF. Например, с помощью двух серверов конфигурации можно защитить до 400 компьютеров.
  • Добавить серверы обработки масштабирования. Использовать их для обработки трафика репликации вместо сервера конфигурации (или вместе с ним).

В следующей таблице описан этот сценарий.

  • Вы настроили сервер обработки масштабирования.
  • Вы настроили защищенные виртуальные машины для использования сервера обработки масштабирования.
  • Каждый защищенный исходный компьютер содержит три диска объемом 100 ГБ каждый.
Дополнительный сервер обработки Размер диска кэша Частота изменения данных Защищаемые компьютеры
4 виртуальных ЦП (2 сокета по 2 ядра с частотой 2,5 ГГц), 8 ГБ памяти 300 ГБ 250 ГБ или менее Репликация не более 85 компьютеров.
8 виртуальных ЦП (2 сокета по 4 ядра с частотой 2,5 ГГц), 12 ГБ памяти 600 ГБ От 251 ГБ до 1 ТБ Репликация 86–150 компьютеров.
12 виртуальных ЦП (2 сокета по 6 ядер @ 2,5 ГГц), 24 ГБ памяти 1 TБ >От 1 ТБ до 2 ТБ Репликация 151–225 компьютеров.

Способ масштабирования серверов зависит от выбранной модели масштабирования — вертикальной или горизонтальной. Чтобы увеличить масштаб, разверните несколько высокопроизводительных серверов конфигурации и серверов обработки. Для масштабирования разверните больше серверов, у которых меньше ресурсов. Например, чтобы защитить 200 машин с общим объемом ежедневно изменяемых данных 1,5 ТБ, вы можете выполнить одно из следующих действий:

  • настройте один сервер обработки (16 виртуальных ЦП и 24 ГБ ОЗУ);
  • настройте два сервера обработки (2 x 8 виртуальных ЦП, 2 по 12 ГБ ОЗУ).

Управление пропускной способностью сети

После того как Планировщик развертывания Site Recovery рассчитает пропускную способность, необходимую для репликации (начальной и разностной), вы можете управлять объемом пропускной способности, используемой для репликации, с помощью нескольких способов.

  • Регулирование пропускной способности. Трафик VMware, который реплицируется в Azure, проходит через определенный сервер обработки. Пропускную способность можно регулировать на компьютерах, которые служат серверами обработки.
  • Влияние на пропускную способность: вы можете повлиять на пропускную способность, используемую для репликации, с помощью пары ключей реестра:
    • Значение реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows Azure Backup\Replication\UploadThreadsPerVM задает количество потоков, используемых для передачи данных диска (для начальной или разностной репликации данных). Если задать высокое значение, пропускная способность сети, используемая для репликации, увеличивается.
    • Значение реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows Azure Backup\Replication\DownloadThreadsPerVM задает количество потоков, используемых для передачи данных при восстановлении размещения.

Регулирование пропускной способности

  1. Откройте оснастку MMC в службе Azure Backup на компьютере, который выступает в качестве сервера обработки. По умолчанию ярлык для резервного копирования доступен на рабочем столе или в следующей папке: C:\Program Files\Microsoft Azure Recovery Services Agent\bin.

  2. В оснастке выберите Change Properties (Изменить свойства).

    Снимок экрана с параметром оснастки MMC в службе Azure Backup для изменения свойств

  3. На вкладке Регулирование установите флажок Разрешить регулирование уровня использования пропускной способности канала для операций резервного копирования. Задайте ограничения для рабочего и нерабочего времени. Допустимы значения в диапазоне от 512 Кбит/с до 1,023 Мбит/с.

    Снимок экрана с диалоговым окном свойств службы Azure Backup

Чтобы настроить регулирование, можно также использовать командлет Set-OBMachineSetting . Ниже приведен пример:

$mon = [System.DayOfWeek]::Monday
$tue = [System.DayOfWeek]::Tuesday
Set-OBMachineSetting -WorkDay $mon, $tue -StartWorkHour "9:00:00" -EndWorkHour "18:00:00" -WorkHourBandwidth  (512*1024) -NonWorkHourBandwidth (2048*1024)

Set-OBMachineSetting -NoThrottle указывает, что регулирование не требуется.

Изменение пропускной способности сети для виртуальной машины

  1. В реестре виртуальной машины перейдите в раздел HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows Azure Backup\Replication.
    • Чтобы изменить скорость передачи данных при репликации диска, измените значение UploadThreadsPerVM. Если ключ еще не существует, создайте его.
    • Чтобы изменить скорость передачи данных при восстановлении размещения из Azure, измените значение DownloadThreadsPerVM.
  2. Значение по умолчанию для каждого ключа — 4. В сети со значительным избыточным резервом для этих разделов реестра необходимо изменить значения по умолчанию. Максимальное значение, которое можно использовать — 32. Следите за трафиком для оптимизации значения.

Настройка инфраструктуры Site Recovery для защиты более 500 виртуальных машин

Перед настройкой инфраструктуры Azure Site Recovery получите доступ к среде для измерения следующих факторов: количество совместимых виртуальных машин, объем ежедневно изменяемых данных, требуемая пропускная способность сети для нужного значения RPO, количество необходимых компонентов Site Recovery, время, необходимое для завершения начальной репликации. Выполните следующие действия, чтобы собрать необходимые сведения.

  1. Чтобы измерить эти параметры, запустите Планировщик развертывания Site Recovery в своей среде. Полезные рекомендации см. в разделе О Планировщике развертывания Azure Site Recovery для восстановления виртуальных машин VMware в Azure.
  2. Разверните сервер конфигурации, который соответствует рекомендациям по размеру сервера конфигурации. Если рабочая нагрузка превышает 650 виртуальных машин, разверните дополнительный сервер конфигурации.
  3. Исходя из измеренного объема ежедневно изменяемых данных, выполните развертывание серверов обработки масштабирования с помощью рекомендаций по размеру сервера обработки.
  4. Если вы ожидаете, что скорость изменения данных для дисковой виртуальной машины превысит 2 МБ/с, убедитесь, что вы используете управляемые диски премиум-класса. Планировщик развертывания Site Recovery запускается в течение определенного периода времени. Пики скорости изменения данных в другое время могут не отражаться в отчете.
  5. Задайте пропускную способность сети в зависимости от нужного значения RPO.
  6. После настройки инфраструктуры включите аварийное восстановление для рабочей нагрузки. Чтобы узнать, как это сделать, см. статью Настройка исходного окружения для репликации из VMware в Azure.

Развертывание дополнительных серверов обработки

Если вы увеличите развертывание так, что количество исходных компьютеров превысит 200 или объем ежедневно изменяемых данных превысит 2 ТБ, для обработки такой нагрузки потребуется добавить серверы обработки. Мы улучшили продукт в версии 9.24, чтобы обеспечить оповещения сервера обработки о том, когда следует настраивать горизонтально масштабируемый технологический сервер. Настройте сервер обработки для защиты новых исходных машин или балансировки нагрузки.

Перенос компьютеров для использования нового сервера обработки

  1. Выберите Параметры>Серверы Site Recovery. Выберите сервер конфигурации и разверните список Серверы обработки.

    Снимок экрана с диалоговым окном

  2. Щелкните используемый сервер обработки правой кнопкой мыши и выберите Switch (Переключить).

    Снимок экрана с диалоговым окном

  3. В поле Выбор целевого сервера обработки выберите новый сервер обработки, который нужно использовать. Затем укажите виртуальные машины, с которыми он будет работать. Щелкните значок сведений, чтобы получить сведения о сервере. Чтобы помочь принять решение о скачивании, отображается средний объем свободного места, требуемый для репликации каждой выбранной виртуальной машины на новом сервере обработки. Установите флажок, чтобы начать репликацию на новом сервере обработки.

Развертывание дополнительных главных целевых серверов

В следующих сценариях требуется более одного главного целевого сервера.

  • Вы хотите защитить виртуальную машину под управлением Linux.
  • Главный целевой сервер, доступный на сервере конфигурации, не имеет доступа к хранилищу данных виртуальной машины.
  • Общее количество дисков на главном целевом сервере (количество локальных дисков на сервере + количество защищаемых дисков) превышает 60.

Чтобы узнать, как добавить главный целевой сервер для виртуальной машины под управлением Linux, см. статью Установка главного целевого сервера Linux для восстановления размещения.

Чтобы добавить новый главный целевой сервер для виртуальной машины под управлением Windows, выполните следующие действия.

  1. Перейдите в раздел Хранилище служб восстановления>Инфраструктура Site Recovery>Серверы конфигурации.

  2. Выберите нужный сервер конфигурации, а затем выберите Главный целевой сервер.

    Снимок экрана, на котором показана кнопка

  3. Загрузите унифицированный файл установки и запустите его на виртуальной машине, чтобы настроить главный целевой сервер.

  4. Выберите Установка главного целевого сервера>Далее.

    Снимок экрана, показывающий выбор опции

  5. Выберите место установки по умолчанию, а затем выберите Install (Установить).

    Снимок экрана, показывающий расположение установки по умолчанию

  6. Для регистрации главного целевого сервера на сервере конфигурации выберите Proceed To Configuration (Перейти к конфигурации).

    Снимок экрана, на котором показана кнопка

  7. Введите IP-адрес сервера конфигурации, а затем введите парольную фразу. Чтобы узнать, как создать парольную фразу, см. раздел Создание парольной фразы сервера конфигурации.

    Снимок экрана, показывающий, где вводить IP-адрес и парольную фразу для сервера конфигурации

  8. Выберите Зарегистрировать. По завершении регистрации выберите Готово.

После успешной регистрации этот сервер будет отображаться на портале Azure в разделе Хранилище служб восстановления>Инфраструктура Site Recovery>Серверы конфигурации в главных целевых серверах сервера конфигурации.

Дальнейшие действия

Скачайте и запустите Планировщик ресурсов Site Recovery.