Поделиться через


Устранение неполадок с репликацией виртуальных машин VMware и физических серверов

В этой статье описаны распространенные неполадки и конкретные ошибки, которые могут возникнуть при репликации локальных физических серверов и виртуальных машин VMware в Azure с помощью Azure Site Recovery.

Шаг 1. Мониторинг работоспособности сервера обработки

Site Recovery использует сервер обработки, чтобы получать, оптимизировать реплицированные данные и отправлять их в Azure.

Рекомендуется отслеживать работоспособность серверов обработки на портале, чтобы убедиться, что они подключены и работают правильно, и что реплика выполняется для исходных компьютеров, связанных с сервером обработки.

Шаг 2. Устранение неполадок с подключением и репликацией

Подключение проблемы с доступностью между исходным сервером и сервером обработки или между сервером обработки и Azure часто вызывают начальные и текущие реплика сбои.

Чтобы решить эти проблемы, выполните устранение неполадок с подключением и репликацией.

Шаг 3. Устранение неполадок на исходных компьютерах, на которых не выполняется репликация

При попытке выбрать исходную машину для включения репликации с помощью Azure Site Recovery она может быть недоступна по одной из следующих причин.

  • Две виртуальные машины с одинаковым экземпляром UUID: если две виртуальные машины в vCenter имеют один и тот же экземпляр UUID, первая виртуальная машина, обнаруженная сервером конфигурации, отображается в портал Azure. Для устранения этой проблемы убедитесь, что виртуальным машинам назначены уникальные UUID экземпляра. Этот сценарий типичен в ситуациях, когда виртуальная машина резервного копирования становится активной и сведения о ней попадают в записи об обнаружении. Обратитесь к статье ASR VMware-to-Azure: How To cleanup duplicate/stale entries (Как удалить повторяющиеся или устаревшие записи при восстановлении из VMware в Azure с помощью ASR), чтобы устранить проблему.
  • Неправильные учетные данные пользователя vCenter. Убедитесь, что вы добавили правильные учетные данные vCenter во время настройки конфигурации с помощью шаблона OVF или процедуры единой настройки. Чтобы проверить учетные данные, добавленные во время установки, обратитесь к разделу Изменение учетных данных для автоматического обнаружения.
  • Недостаточные привилегии vCenter. Если разрешения, предоставленные для доступа к vCenter, недостаточны, может произойти сбой обнаружения виртуальных машин. Убедитесь, что разрешения, описанные в разделе Подготовка учетной записи для автоматического обнаружения, добавлены в учетную запись пользователя vCenter.
  • Серверы управления Azure Site Recovery. Если виртуальная машина используется в качестве сервера управления под одной или несколькими из следующих ролей: сервер конфигурации /сервер обработки /масштабируемый сервер или главный целевой сервер, вы не сможете выбрать виртуальную машину на портале. Серверы управления не могут быть реплицированы.
  • Виртуальная машина уже защищена, или для нее выполнена отработка отказа с помощью служб Azure Site Recovery. Если виртуальная машина уже защищена или для нее выполнена отработка отказа с помощью Site Recovery, она будет недоступна для включения защиты на портале. Убедитесь, что виртуальная машина, которую вы ищете на портале, не защищена другим пользователем или в рамках другой подписки.
  • vCenter не подключен: проверьте, находится ли vCenter в подключенном состоянии. Чтобы проверить, перейдите в "Хранилище Служб восстановления > Инфраструктура Site Recovery > Серверы конфигурации">. Щелкните соответствующий сервер конфигурации,> и справа откроется колонка с подробными сведениями о связанных серверах. Проверьте, подключен ли vCenter. Если он находится в состоянии "Не Подключение", устраните проблему и обновите сервер конфигурации на портале. После этого виртуальная машина не отображается на портале.
  • ESXi отключен: если узел ESXi, в котором находится виртуальная машина, находится в состоянии выключенного питания, виртуальная машина не указана или не выбрана в портал Azure. Включите узел ESXi и обновите сервер конфигурации на портале. После этого виртуальная машина отображается на портале.
  • Ожидающая перезагрузка: если на виртуальной машине ожидается перезагрузка, вы не сможете выбрать компьютер на портал Azure. Убедитесь, что необходимо завершить ожидающие действия перезагрузки и обновить сервер конфигурации. После этого виртуальная машина отображается на портале.
  • IP-адрес не найден или компьютер не имеет IP-адреса: если у виртуальной машины нет допустимого IP-адреса, то вы не сможете выбрать компьютер на портал Azure. Убедитесь, что назначьте действительный IP-адрес виртуальной машине и обновите сервер конфигурации. Это также может быть вызвано, если компьютер не имеет допустимого IP-адреса, связанного с одним из сетевых адаптеров. Назначьте допустимый IP-адрес всем сетевым адаптерам или удалите сетевой адаптер, которому не назначен IP-адрес. После этого виртуальная машина отображается на портале.

Устранение неполадок, когда защищенные виртуальные машины отображаются на портале серым цветом

Виртуальные машины, которые реплицируются Site Recovery, недоступны на портале Azure, если в системе существуют повторяющиеся записи. Узнайте больше об удалении устаревших записей и устранении проблемы.

Другой причиной может быть клонирование компьютера. При перемещении компьютеров между гипервизором и изменением идентификатора BIOS агент мобильности блокирует реплика. Репликация клонированных компьютеров не поддерживается Site Recovery.

За последние минуты "XXX" для виртуальной машины не доступна точка восстановления, согласованная с аварийной производительностью.

Ниже приведен список некоторых наиболее распространенных проблем:

Проблемы с начальной репликацией (ошибка 78169)

Убедитесь, что нет проблем с подключением, пропускной способностью или синхронизацией времени, убедитесь, что:

  • Антивирусная программа не блокирует Azure Site Recovery. Узнайте больше об исключениях папок, необходимых для Azure Site Recovery.

Исходные компьютеры с высокой скоростью обработки данных (ошибка 78188)

Возможные причины:

  • Скорость изменения данных (записанных байт/с) на перечисленных дисках виртуальной машины превышает поддерживаемые ограничения Azure Site Recovery для выбранного типа учетной записи хранения для целевого объекта репликации.
  • Резкое увеличение скорости оттока из-за того, что большое количество данных ожидает отправки.

Способы устранения проблемы.

  • Убедитесь, что целевой тип учетной записи хранения (цен. категория "Стандартный" или "Премиум") подготавливается согласно требованию о скорости оттока в источнике.

  • Если вы уже выполняете репликацию на управляемый диск уровня "Премиум" (тип asrseeddisk), убедитесь, что размер диска поддерживает наблюдаемую скорость обработки в соответствии с ограничениями Site Recovery. При необходимости можно увеличить размер asrseeddisk. Выполните следующие действия:

    • Перейдите в колонку "Диски" для затронутой реплицируемой машины и скопируйте имя диска реплики.
    • Перейдите к управляемому диску этой реплики.
    • В колонке "Обзор" может появиться баннер с сообщением о том, что создан подписанный URL-адрес. Щелкните этот баннер и отмените экспорт. Игнорируйте этот шаг, если баннер не отображается.
    • Как только URL-адрес SAS отозван, перейдите в колонку "Конфигурация управляемого диска" и увеличьте размер, чтобы Azure Site Recovery поддерживал наблюдаемую скорость оттока на исходном диске.
  • Если наблюдаемый отток является временным, подождите несколько часов, пока ожидается отправка данных, чтобы выполнить поиск и создать точки восстановления.

  • Если диск содержит некритичные данные, такие как временные журналы, тестовые данные и т. д., рассмотрите возможность перемещения этих данных в другое место или полностью исключите этот диск из реплика tion

  • Если проблема сохраняется, примените планировщик развертывания Site Recovery, чтобы спланировать репликацию.

Исходные компьютеры не имеют пульса (ошибка 78174)

Это происходит, когда агент Azure Site Recovery Mobility на исходном компьютере, который они взаимодействуют с сервером конфигурации (CS).

Чтобы устранить эту проблему, выполните следующие действия для проверки возможности подключения к серверу конфигурации с исходной виртуальной машины:

  1. Убедитесь, что исходный компьютер запущен.

  2. Войдите на исходный компьютер, используя учетную запись с правами администратора.

  3. Убедитесь, что следующие службы запущены, и перезапустите их, если потребуется:

    • Svagents (InMage Scout VX Agent);
    • служба приложений InMage Scout;
  4. На исходном компьютере изучите журналы, чтобы получить сведения об ошибках:

    C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

Сервер обработки не имеет пульса (ошибка 806)

В случае отсутствия пульса на сервере обработки проверка, что:

  1. Виртуальная машина сервера обработки запущена и запущена

  2. Проверьте следующие журналы на сервере обработки для получения сведений об ошибке:

    C:\ProgramData\ASR\home\svsystems\eventmanager*.log
    и
    C:\ProgramData\ASR\home\svsystems\monitor_protection*.log

Основной целевой сервер не имеет пульса (ошибка 78022)

Это происходит, когда агент Мобильности Azure Site Recovery на главном целевом объекте не взаимодействует с сервером конфигурации.

Чтобы устранить эту проблему, выполните следующие действия по проверке состояния службы:

  1. Убедитесь, что главный целевой сервер работает.
  2. Войдите на главный целевой сервер, используя учетную запись с правами администратора.
    • Убедитесь, что служба svagents запущена. Если она запущена, перезапустите службу

    • Проверьте журналы в следующем расположении, чтобы получить сведения об ошибке:

      C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

  3. Чтобы зарегистрировать главный целевой объект на сервере конфигурации, перейдите в папку %PROGRAMDATA%\ASR\Agent и выполните следующую команду в командной строке:
    cmd
    cdpcli.exe --registermt
    
    net stop obengine
    
    net start obengine
    
    exit
    

Защита не удалось включить для виртуальной машины [ошибка 78253]

Эта ошибка может возникнуть, если политика реплика не связана с сервером конфигурации должным образом. Это также может произойти, если политика, связанная с сервером конфигурации, не является допустимой.

Чтобы подтвердить причину этой ошибки, перейдите в хранилище > восстановления, управляя инфраструктурой Site Recovery, а затем просмотрите политики реплика tion для VMware и физических компьютеров, чтобы проверка состояние настроенных политик.

Чтобы устранить проблему, можно связать политику с сервером конфигурации, используемой или создать новую политику реплика tion и связать ее. Если политика недопустима, ее можно отключить и удалить.

Ошибка 78144: "No crash consistent recovery point available for the VM in the last ХХ minutes" (Для виртуальной машины нет отказоустойчивой точки восстановления за последние ХХ минут).

Усовершенствования были сделаны в агенте мобильности 9.23 и 9.27 версий для обработки ошибок установки VSS. Убедитесь, что вы находитесь в последних версиях, чтобы получить рекомендации по устранению сбоев VSS.

Перечислены некоторые из наиболее распространенных проблем:

Причина 1. Известная проблема в SQL Server 2008 и 2008 R2

Практическое руководство. Существует известная проблема с SQL Server 2008/2008 R2. Ознакомьтесь с этой статьей базы знаний: Агент Azure Site Recovery или другие операции резервного копирования VSS не на основе компонента завершаются с ошибкой на сервере размещения SQL Server 2008 R2.

Причина 2. Сбой заданий Azure Site Recovery на серверах, где размещается любая версия экземпляров SQL Server с базами данных AUTO_CLOSE

Практическое руководство. См. статью базы знаний

Практическое руководство. См. статью КБ

Причина 3. Известная проблема в SQL Server 2016 и 2017

Практическое руководство. См. статью базы знаний

Причина 4. Согласованность приложений не включена на серверах Linux

Практическое руководство. Azure Site Recovery для операционной системы Linux поддерживает пользовательские скрипты приложений для согласованности приложений. Пользовательский сценарий с параметрами до и после будет использоваться агентом мобильности Azure Site Recovery для согласованности приложений. Вот шаги, чтобы включить его.

Для дальнейшего устранения неполадок проверьте файлы на исходном компьютере, чтобы получить точный код ошибки:

C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log

Как найти ошибки в файле? Выполните поиск по строке "vacpError", открыв файл vacp.log в редакторе.

Ex: vacpError:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|

В предварительном примере 2147754994 — это код ошибки, который сообщает о сбое, как показано ниже.

Модуль записи VSS не установлен — ошибка 2147221164

Практическое руководство. Чтобы создать тег согласованности приложений, Azure Site Recovery использует службу теневого копирования томов (VSS). Она в свою очередь устанавливает поставщик VSS, чтобы получать моментальные снимки согласованности приложений. Поставщик VSS устанавливается как служба. Если служба поставщика VSS не установлена, создание моментального снимка согласованности приложения завершается ошибкой 0x80040154 "Класс не зарегистрирован".

Воспользуйтесь статьей по устранению неполадок при установке модуля записи VSS.

Модуль записи VSS отключен — ошибка 2147943458

Практическое руководство. Чтобы создать тег согласованности приложений, Azure Site Recovery использует службу теневого копирования томов (VSS). Она в свою очередь устанавливает поставщик VSS, чтобы получать моментальные снимки согласованности приложений. Поставщик VSS устанавливается как служба. Если служба поставщика VSS отключена, создание моментального снимка согласованности приложения завершается ошибкой с идентификатором "Указанная служба отключена и не может быть запущена (0x80070422)".

  • Если VSS отключен,
    • Убедитесь, что для параметра "Тип запуска" службы поставщика VSS задано значение Автоматически.
    • Перезапустите следующие службы:
      • служба VSS;
      • поставщик VSS Azure Site Recovery.
      • служба VDS.

Поставщик VSS не зарегистрирован — ошибка 2147754756

Практическое руководство. Чтобы создать тег согласованности приложений, Azure Site Recovery использует службу теневого копирования томов (VSS). Проверьте, установлена ли служба поставщика VSS для Azure Site Recovery.

  • Выполните следующие команды для повторной установки поставщика.
  • Удалите имеющийся поставщик: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
  • Повторите установку: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Install.cmd

Убедитесь, что для параметра "Тип запуска" службы поставщика VSS задано значение Автоматически. Перезапустите следующие службы: службу VSS, поставщик VSS Azure Site Recovery и службу VDS.

Идентификатор ошибки 95001 - Обнаружены недостаточные разрешения

Эта ошибка возникает при попытке включить репликацию, а для папок приложений недостаточно разрешений.

Как устранить эту проблему, убедитесь, что пользователь IUSR имеет роль владельца для всех следующих папок.

  • C\ProgramData\Microsoft Azure Site Recovery\private
  • Каталог установки. Например, если каталог установки является диском F, укажите правильные разрешения:
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems
  • Папка \pushinstallsvc в каталоге установки. Например, если каталог установки является диском F, укажите правильные разрешения для -
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\pushinstallsvc
  • Папка \etc в каталоге установки. Например, если каталог установки является диском F, укажите правильные разрешения для -
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\etc
  • C:\Temp
  • C:\thirdparty\php5nts
  • Все элементы под следующим путем :
    • C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*

Устранение неполадок и обработка изменений времени на реплицированных серверах

Эта ошибка возникает, когда время исходного компьютера перемещается вперед, а затем перемещается обратно в короткое время, чтобы исправить изменение. Вы можете не заметить изменение, так как время исправляется быстро.

Практическое руководство. Чтобы устранить эту проблему, подождите, пока системное время не пересекает скошенное будущее время. Другим вариантом является отключение и включение реплика tion еще раз, что возможно только для перенаправления реплика (данные реплика из локальной среды в Azure) и неприменимо для обратного реплика tion (данные реплика из Azure в локальную среду).

Следующие шаги

Если вам нужна дополнительная помощь, опубликуйте свой вопрос на странице вопросов Microsoft Q&A для Azure Site Recovery. У нас активное сообщество, и один из наших инженеров сможет помочь вам.