Непрерывность бизнес-процессов и аварийное восстановление для Решения Azure VMware

Этот сценарий корпоративного масштаба помогает улучшить непрерывность бизнес-процессов и аварийное восстановление (BCDR). Решение Azure VMware предоставляет частные облака, содержащие кластеры VMware vSphere, созданные из выделенной инфраструктуры Azure без операционной системы. Решение предоставляет не менее трех узлов ESXi, до 16 узлов на кластер. Все подготовленные частные облака имеют VMware vCenter Server, VMware vSAN, VMware vSphere и VMware NSX-T Data Center. Сведения о соглашении об уровне обслуживания (SLA) для Решение Azure VMware см. в разделе об уровне обслуживания для Решение Azure VMware.

Независимо от того, есть ли у вас локальная среда или Решение Azure VMware, следует учитывать различные факторы BCDR для подготовки к аварии. Надежный план BCDR направлен на защиту компании от потери данных, финансовой потери и простоя при возникновении разрушительных событий. В следующем дереве принятия решений показаны различные варианты BCDR, доступные для Решение Azure VMware.

Diagram that shows a flow chart for business continuity and disaster recovery.

Примечание.

Пилотная среда освещения настраивается с минимальной конфигурацией, но только основные компоненты для поддержки критического набора приложений. Однако он может масштабировать и создавать больше узлов, чтобы принять большую часть нагрузки, если происходит отработка отказа. Для аварийного восстановления рабочих нагрузок решения Azure VMware для аварийного восстановления вычислительных ресурсов и памяти на дополнительном сайте требуется одинаковое количество хранилища.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Политики хранилища vSAN VMware в Решении Azure VMware реализуются с учетом доступности хранилища. Если кластер имеет от трех до пяти узлов, количество сбоев узлов, которые могут быть разрешены без потери данных, равно одному. Если кластер содержит от шести до шестнадцати узлов, то число узлов, на которых может возникнуть сбой без последующей потери данных, равно двум. Политики хранилища vSAN VMware можно применять к отдельным виртуальным машинам. Хотя эти политики являются стандартными, вы можете изменить политику в соответствии с пользовательскими требованиями. Дополнительные сведения см. в разделе Концепции хранилища для Решения Azure VMware.

  • Высокий уровень доступности vSphere включен по умолчанию в Решение Azure VMware. Политика обеспечения высокой доступности резервирует вычислительные ресурсы и емкость памяти для одного узла. Это резервирование обеспечивает достаточную емкость для перезапуска рабочих нагрузок в другом узле в кластере Решение Azure VMware.

  • Высокий уровень доступности с растянутыми кластерами: при использовании Решение Azure VMware узлы ESXi, развернутые в стандартном кластере vSphere, традиционно находятся в одной зоне доступности Azure и защищены высокой доступностью vSphere. Однако рабочие нагрузки не защищены от сбоя зоны доступности. Чтобы защититься от сбоя, один кластер vSAN может охватывать две отдельные зоны доступности, называемые растянутыми кластерами vSAN. Дополнительные сведения см. в статье "Развертывание растянутых кластеров vSAN".

  • Выберите проверенное решение для резервного копирования виртуальных машин VMware vSphere (виртуальных машин), таких как Microsoft Azure Backup Server или решение для резервного копирования партнера.

  • Сведения о поддерживаемых функциях в решениях резервного копирования партнеров см. в соответствующей документации партнера.

    Примечание.

    Конфигурации vCenter Server и NSX-T Data Center для частных облаков создаются почасово, а резервные копии хранятся в течение трех дней.

  • Решение Azure VMware компоненты, такие как vCenter Server, NSX-T Manager или HCX Manager, являются управляемыми службами, для которых Azure управляет резервным копированием. Чтобы восстановить резервную копию, создайте запрос в службу поддержки Azure.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Используйте Azure Backup Server для резервного копирования Решение Azure VMware частного облака. Дополнительные сведения см. в статье Резервное копирование виртуальных машин VMware vSphere с помощью Azure Backup. Поддерживаемые топологии развертывания включают агент MARS и диспетчер защиты данных. Каждая топология развертывания имеет собственную матрицу поддержки, ограничения и ограничения.

  • Разверните Azure Backup Server в том же регионе Azure, что и частное облако Решения Azure VMware. Этот метод развертывания сокращает затраты на трафик, упрощает администрирование и позволяет сохранить основную и дополнительную топологию. Ознакомьтесь с руководством по выбору регионов Azure для рекомендаций по развертыванию регионов Azure.

  • Azure Backup можно развернуть как инфраструктуру Azure как виртуальную машину службы (IaaS) или в Решение Azure VMware частном облаке. Настоятельно рекомендуется развернуть его за пределами частного облака Решение Azure VMware. Разверните резервную копию в виртуальной сети Azure и убедитесь, что эта виртуальная сеть подключена к той же ExpressRoute, которая подключена к частному облаку Решение Azure VMware. Запуск резервного сервера за пределами частного облака Решение Azure VMware помогает сократить потребление vSAN, так как vSAN является ограниченным ресурсом емкости в Решение Azure VMware частном облаке.

    Azure Backup Server, развернутый как виртуальная машина IaaS Azure.

    Diagram that shows Azure Backup Server deployed as an Azure IaaS VM.

    Azure Backup Server, развернутый как виртуальная машина Решение Azure VMware.

    Diagram that shows Azure Backup Server deployed as an Azure VMware Solution VM.

  • Используйте требования к производительности приложения, проверка список, чтобы получить правильный тип емкости и диска, например HDD, SSD или Ultra. Рассмотрим номер SKU виртуальной машины IaaS Azure, поддерживающий тип диска и емкость для операций резервного копирования.

  • Используйте планировщик емкости Azure Backup Server для определения количества серверов, хранилища и операций ввода-вывода в секунду для каждого из них. При предоставлении значения "Общий размер рабочей нагрузки (ГБ)*" в планировщике емкости используйте медиановое значение между "используемым хранилищем" и "выделенным хранилищем" всех виртуальных машин в vCenter, которые требуется создать резервную копию.

  • Используйте пулы носителей с Azure Backup Server для расширенного ввода-вывода в секунду или пропускной способности диска. Используйте многоуровневый хранилище в Backup Server для расширенных операций. Задайте для параметра DisableWriteAutoTiering значение конфигурации 1 на томе MABS, чтобы весь уровень производительности был доступен для хранения метаданных ReFS.

  • Определите количество параллельных заданий резервного копирования и операций восстановления, выполняемых на сервере Azure Backup. В настоящее время поддерживаются восемь параллельных заданий резервного копирования. Измеряйте время, затраченное на резервное копирование и восстановление критически важных рабочих нагрузок на нескольких запусках. Убедитесь, что время резервного копирования и восстановления соответствует требованиям RPO и RTO для сервера Azure Backup. Убедитесь, что хранилище данных AVS vSAN имеет достаточную емкость для хранения восстановленной резервной копии.

  • Добавьте необходимые исключения антивирусной программы для файлов и папок Azure Backup Server, как описано здесь , если на Сервере Azure Backup Server запущено какое-либо антивирусное или антивредоносное программное обеспечение. При использовании агента защиты DPM на любой Решение Azure VMware виртуальной машине для резервного копирования приложений (например, SQL, Sharepoint и т. д.), отключите мониторинг dpmra.exe в режиме реального времени.

  • Настройте соответствующие правила NSG (группа безопасности сети) в подсети, где размещен Azure Backup Server, чтобы разрешить сетевое взаимодействие с агентом защиты DPM, работающим на защищенной виртуальной машине в Решение Azure VMware. Агент защиты DPM взаимодействует с Azure Backup Server на любом динамическом порту от 1024 до 65535.

  • В настоящее время Azure Backup Server не поддерживает восстановление между регионами для Решение Azure VMware частного облака. Обратитесь к решениям резервного копирования партнеров и разделу аварийного восстановления, если требуется восстановление между регионами Решение Azure VMware.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • Выравнивайте бизнес-требования с целями времени восстановления (RTO), емкостью и целями точки восстановления (RPO) для приложений. Планируйте и проектируйте соответствующим образом эти цели с помощью наиболее подходящей технологии реплика tion. Например, изначально реплика te SQL базы данных с помощью группы доступности SQL AlwaysOn или используйте средство аварийного восстановления, например диспетчер восстановления сайта VMware.

  • Определите целевой сайт аварийного восстановления для защищенного Решение Azure VMware частного облака. Этот сайт влияет на то, какие средства аварийного восстановления подходят для среды. Например, если вы хотите восстановить рабочие нагрузки Решение Azure VMware на собственных виртуальных машинах IaaS Azure, можно рассмотреть Azure Site Recovery или Zerto.

  • Определите, какой подмножество рабочих нагрузок Решение Azure VMware требует защиты, если произошло событие аварийного восстановления. Рассмотрите возможность классификации рабочих нагрузок на основе приоритета: P0 для критически важных для бизнеса рабочих нагрузок, а также P1, P2, P3 для других рабочих нагрузок, которые важны, но не столь важны для работы бизнеса. План непрерывности бизнес-процессов клиента определяет уровни приоритета, которые помогают контролировать затраты, связанные с реализацией аварийного восстановления.

  • В большинстве случаев непроизводственные среды, такие как разработка, тестирование или UAT, не требуют отработки отказа на дополнительный сайт. Чтобы сэкономить на затратах, необходимо запустить пилотный свет на вторичном сайте с уменьшенной емкостью для рабочих и критически важных рабочих нагрузок. Для увеличения емкости можно увеличить масштаб, чтобы добавить узлы ESXi в кластер во время события аварийного восстановления.

  • Для пилотных развертываний особенно убедитесь, что вы обеспечили всю квоту узла, необходимую на вторичном сайте, чтобы не пришлось ждать требуемой емкости во время полного масштабирования. См. квоту узла запроса для Решение Azure VMware.

  • Настройте функциональные роли домена, такие как контроллеры домена Active Directory, в дополнительной среде.

  • Решения от партнеров, таких как JetStream и Zerto, обычно доступны и проверяются на Решение Azure VMware. Они поддерживают большинство сценариев аварийного восстановления и могут обеспечить более быстрое восстановление с почти нулевым RPO.

  • VMware Site диспетчер восстановления, Jetstream и Zerto поддерживают миграцию из сторонних расположений в Решение Azure VMware.

  • VMware HCX также является экономичным решением для аварийного восстановления. Однако не рекомендуется выполнять большие рабочие нагрузки из-за ручной оркестрации.

  • Для аварийного восстановления между Решение Azure VMware частными облаками в разных регионах Azure необходимо включить ExpressRoute Global Reach между двумя внутренними каналами ExpressRoute. Эти каналы создают подключение первичного к вторичному частному облаку при необходимости для таких решений, как VMware SRM и VMware HCX.

  • Для аварийного восстановления между Решение Azure VMware частными облаками в одном регионе Azure необходимо включить Решение Azure VMware Interconnect. Он создает связь маршрутизации между сетями управления и рабочей нагрузки Решение Azure VMware частных облаков для обмена данными между облаками. Убедитесь, что перенаправленное пространство IP-адресов в каждом частном облаке уникально и не перекрывается.

  • При работе с аварийным восстановлением можно использовать одно и то же исходное IP-пространство в основном регионе Azure и дополнительном регионе Azure. Однако для этого требуются дополнительные усилия по проектированию и проектированию.

    • Сохраните те же IP-адреса: виртуальные машины на вторичном Решение Azure VMware сайте можно восстановить с помощью того же исходного IP-адреса, что и основной сайт. Для этого метода создайте изолированные сегменты VLAN или NSX-T на вторичном сайте и убедитесь, что ни один из этих изолированных виртуальных ЛС или сегментов не подключен к среде. Измените маршруты аварийного восстановления, чтобы отразить, что подсеть перемещена на дополнительный сайт и новое расположение IP-адресов. Хотя этот метод работает, он также создает инженерные издержки при попытке полностью автоматизированного аварийного восстановления.

    • Использовать другие IP-адреса. Для восстановленных виртуальных машин можно также использовать другие IP-адреса. Если виртуальная машина перемещается на дополнительный сайт, план восстановления на сайте VMware диспетчер восстановления сведения о пользовательской карте IP-адресов. Выберите эту карту, чтобы изменить IP-адрес. Виртуальные машины создаются в новых сегментах NSX-T и назначаются новые IP-адреса. Инструменты могут отличаться для различных решений аварийного восстановления.

  • Важные факторы для сценариев частичного и полного аварийного восстановления:

    • VMware Site диспетчер восстановления поддерживает частичное восстановление, которое восстанавливает только подмножество виртуальных машин и полное аварийное восстановление. Между двумя Решение Azure VMware сайтами в регионе 1 и регионе 2 все или некоторые виртуальные машины могут выполнять отработку отказа.

    • Требование хранения исходного IP-адреса для восстановленных виртуальных машин определяет, возможно ли частичное и полное аварийное восстановление.

    • Чтобы сохранить исходный IP-адрес при выполнении частичного аварийного восстановления на сайте диспетчер восстановления, шлюз подсети должен перейти на дополнительный сайт.

    Примечание.

    Аварийное восстановление в режиме активного ожидания не требует растяжения уровня 2.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • При работе с Решение Azure VMware на первичных и вторичных сайтах используйте диспетчер восстановления сайта VMware. Основные и дополнительные сайты также называются защищенными сайтами и сайтами восстановления соответственно.

    Общие сведения о непрерывной реплика реплика sphere.

    Diagram that shows a high-level example of continuous vSphere replication between two Azure VMware Solution sites.

    Подробный пример непрерывной реплика реплика между первичными и вторичными сайтами.

    Diagram that shows a detailed example of continuous vSphere replication between two Azure VMware Solution sites.

  • Для критически важных для бизнеса приложений Zerto и JetStream доступны в качестве решений для аварийного восстановления для Решение Azure VMware частного облака. JetStream и Zerto основаны на основе непрерывной защиты данных (CDP), используя API VMware vSphere для фильтрации операций ввода-вывода (VAIO), которая обеспечивает минимальный или близкий к потере данных. Она также обеспечивает экономичное аварийное восстановление с помощью минимальных ресурсов.

  • Используйте Azure Site Recovery или Zerto, если виртуальные машины IaaS Azure являются целевым объектом аварийного восстановления для Решение Azure VMware частного облака.

  • Свести к минимуму входные данные вручную с помощью автоматизированных планов восстановления в каждом из соответствующих решений аварийного восстановления. Эти планы полезны при работе с диспетчер восстановления сайта VMware или партнерскими решениями. План восстановления позволяет объединять компьютеры в группы восстановления для отработки отказа. Затем он помогает определить систематический процесс восстановления путем создания независимых единиц, которые могут выполнять отработку отказа.

  • Настройте тесты дыма или аварийное восстановление по крайней мере один раз в год, чтобы обеспечить работу планов восстановления должным образом. Возможности оркестрации выбранного средства аварийного восстановления определяют уровень усилий, связанных с выполнением этих детализаций.

  • Используйте геополитические региональные пары в качестве вторичной среды аварийного восстановления. Некоторые преимущества региональных пар являются приоритетными для восстановления региона, последовательных обновлений, физической изоляции и расположения данных.

  • Сохраняйте адресные пространства разными, чтобы избежать перекрытия IP-адресов между двумя сайтами. Например, можно использовать 192.168.0.0/16 для региона 1 и 10.0.0.0/16 для региона 2.

  • Используйте подключение ExpressRoute Global Reach между основными и вторичными частными облаками в разных регионах. Дополнительные сведения и рекомендации по работе с сетью см. в соответствующей области проектирования.

Следующие шаги

Ознакомьтесь с рекомендациями по первоначальному развертыванию Решения Azure VMware и автоматизации операций.