Поделиться через


Устранение неполадок с управляемым экземпляром SCOM в Azure Monitor

Примечание.

Управляемый экземпляр Azure Monitor SCOM больше не поддерживается и планируется снять с поддержки к 30 сентября 2026 года. Это содержимое больше не будет обновлено. Мы рекомендуем Azure Monitor или System Center Operations Manager в качестве альтернативного решения на основе ваших требований.

В этой статье описываются ошибки, которые могут возникнуть при развертывании или использовании Управляемого экземпляра Azure Monitor SCOM и способы их решения.

Сценарий: создание и развертывание управляемого экземпляра SCOM

Общие действия по устранению неполадок

  1. Убедитесь, что выполнены все предварительные условия. Проблемы с созданием могут возникнуть из-за неправильных или неполных предварительных требований.
  2. Убедитесь, что вы внимательно считываете или проверяете сообщение об ошибке. Сообщения об ошибках фиксируют проблему или ошибку при создании.
  3. Проверьте ссылку на журналы установки SCOM, указанную в сообщении об ошибке. Выберите ссылку, чтобы скачать журналы установки System Center Operations Manager. Анализ журналов для выявления и устранения ошибок и сбоев.
  4. Если, выполнив указанные выше действия, вам не удается определить проблему, войдите в экземпляр масштабируемого набора виртуальных машин и проверьте журналы в C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.ScomServer.ScomServerForWindows<версия>. Это поможет вам выявить проблему.
  5. Если проблема сохраняется, вызовите запрос в службу поддержки со всеми соответствующими сведениями [correlation-id, subscription-idи т. д.]

Проблема. Группа %ResourceGroupName% ресурсов управляется другим ресурсом Azure

Причина. Возникает, когда для группы ресурсов задано свойство ManagedBy .

Разрешение. Укажите другую группу ресурсов с свойством ManagedBy как пустую.

Проблема. Выбранная подсеть %SubnetName% выделена для другой службы

Причина. Возникает, когда в подсети есть делегирования.

Решение: Укажите подсеть, которая не делегирована какой-либо другой службе.

Проблема: Ошибка, когда управляемый экземпляр SCOM не может получить доступ к управляемому экземпляру SQL %instance%

Причина: эта ошибка может быть вызвана любой из следующих причин:

  • Отсутствует видимость линии видимости из SCOM Управляемый экземпляр виртуальной сети в конечную точку Управляемый экземпляр SQL.
  • Отсутствуют правильные правила NSG, позволяющие трафик к общедоступной конечной точке Управляемого экземпляра SQL.
  • MSI не добавляется в качестве администратора Active Directory.
  • Управляемый экземпляр SCOM может не иметь разрешений на чтение Управляемый экземпляр SQL.
  • Может возникнуть проблема с виртуальной сетью или регионом.

Решение.

  • Предоставьте разрешение на чтение Управляемый экземпляр SQL.
  • MSI необходимо добавить в качестве администратора Active Directory в Управляемый экземпляр SQL.
  • Убедитесь, что подключение между SCOM Управляемый экземпляр и сетями Управляемый экземпляр SQL. Дополнительные сведения см. в статье "Создание и настройка Управляемый экземпляр SQL".

Проблема. Недостаточно ядер для создания %instance% в данном регионе

Причина. Возникает, когда недостаточно ядер для создания экземпляра в заданном регионе.

Решение: Проверьте раздел квоты на портале Azure и при необходимости выделите больше ядер типа Standard Ds3v2 в регионе.

Проблема. Секретный ключ с тем же именем уже присутствует в хранилище ключей

Причина. Возникает, когда другой секретный ключ с тем же именем уже присутствует в хранилище ключей.

Решение: Измените имя экземпляра.

Проблема: виртуальная машина сообщила о сбое при подключении модуля joindomain обработки к домену %DomainName%

Причина: возникает из-за следующих причин:

  1. Линия видимости от управляемого экземпляра сервера SCOM к контроллеру домена.
  2. Учетные данные пользователя домена не предоставляются или не указаны.
  3. Путь к подразделению для домена AD не указан.

Решение. Проверьте причину и, соответственно, попробуйте устранить проблему.

Проблема: статический IP-адрес уже используется

Причина. Возникает, если статический IP-адрес используется другим экземпляром.

Разрешение. Используйте другой статический IP-адрес.

Проблема: недопустимый тип идентификации %identityType%

Причина: Возникает из-за неправильной управляемой идентичности.

Решение: Укажите один из возможных типов удостоверений ((None), (SystemAssigned), (UserAssigned)) и повторите попытку.

Проблема. Частный статический IP-адрес %LbIpAddr% не принадлежит диапазону подсети %subnet%

Причина. Возникает, так как IP-адрес отсутствует в диапазоне подсети.

Разрешение. Укажите доступный IP-адрес из диапазона подсети и повторите операцию.

Проблема: Учетная запись не является системным администратором в управляемом экземпляре SQL: '%instance'.

Причина: возникает из-за следующих причин:

  1. Управляемое удостоверение пользователя не является администратором SQL в SQL MI.
  2. Управляемое удостоверение пользователя подтверждается администратором SQL в SQL MI, и оно развертывается с помощью ARM, BICEP, Terraform или другого решения развертывания.

Разрешение: Убедитесь, что Управляемое удостоверение пользователя развертывается с использованием AppId, а не ObjectId. Вы можете подтвердить, применимо ли это, перейдя на панель управления SQL MI, Microsoft Entra ID. Проверьте, является ли идентификатор GUID, указанный вместе с управляемым удостоверением пользователя, ObjectId или AppId главной службы. Если это Объектный идентификатор:

  • Настройте это через портал
  • Выполните повторное развертывание, используя предпочитаемое решение с использованием AppId.

Сценарий. Развертывание отчетов в Power BI

Проблема: Управляемый экземпляр SQL недоступен

Причина. Происходит, если общедоступная конечная точка не включена. Power BI не сможет получить доступ к управляемому экземпляру SQL.

Разрешение. Проверьте разрешения пользователя на Управляемый экземпляр SQL и укажите необходимые разрешения.

Проблема. Не удается обновить учетные данные набора данных

Причина. Происходит, если у пользователя нет соответствующих разрешений на Управляемый экземпляр SQL.

Разрешение. Проверьте разрешения пользователя на Управляемый экземпляр SQL и укажите необходимые разрешения.

Проблема. Отчет не удается обновить

Причина. Происходит из-за большого размера данных. Отчет может не обновляться.

Решение. Если рабочая область Power BI находится на уровне pro , измените ее на премиум или измените емкость рабочей области.

Сценарий. Увеличение или уменьшение масштаба вручную

Проблема: сбой теста подключения к Интернету. Необходимые конечные точки недоступны из виртуальной сети

Причина: проблема с сетью.

Разрешение. Убедитесь, что Управляемый экземпляр SCOM имеет исходящий доступ к Интернету и NSG/Брандмауэр правильно настроен, чтобы разрешить доступ к необходимым конечным точкам, как описано в требованиях к брандмауэру.

Проблема: превышена квота

Причина. Возникает, если для масштабирования нет ядер.

Разрешение. Увеличьте количество ядер в подписке.

При необходимости проверьте раздел квоты на портал Azure и выделите больше ядер типа Standard Ds3v2 в регионе.

Проблема: ошибка подготовки расширений

Причина. Эта ошибка может возникать во время подготовки расширения System Center Operations Manager или установки System Center Operations Manager.

Решение. Проверьте общее устранение неполадок, попробуйте определить проблему и устранить ее соответствующим образом.

Проблема: конфликт

Причина. Происходит, если выполняется исправление или масштабирование. Не удается активировать новую операцию.

Решение. Дождитесь завершения текущего процесса и повторите попытку.

Сценарий: исправление

Проблема: сбой теста подключения к Интернету. Необходимые конечные точки недоступны из виртуальной сети

Причина: проблема с сетью.

Разрешение. Убедитесь, что Управляемый экземпляр SCOM имеет исходящий доступ к Интернету и NSG/Брандмауэр правильно настроен, чтобы разрешить доступ к необходимым конечным точкам, как описано в требованиях к брандмауэру.

Проблема: Уведомление зависает при получении обновлений, хотя операция обновления завершена

Причина: проблема с сетью или разработка.

Решение: Попробуйте обновить страницу для получения обновлений. Если это не разрешено, обратитесь в службу поддержки Майкрософт.

Проблема. Состояние обновления не отражается правильно на карточке

Причина: проблема с сетью или разработка.

Решение: Попробуйте обновить страницу для получения обновлений. Если это не разрешено, обратитесь в службу поддержки Майкрософт.

Проблема. Несоответствие элементов управления в карточке

Причина: проблема согласованности. Например, кнопка обновления включена, даже если заголовок карточки гласит SCOM обновлён.

Разрешение. Попробуйте обновить. Если это не разрешено, обратитесь в службу поддержки Майкрософт.

Проблема: появляется предупреждающее сообщение для обновлений

Причина: возникает из-за любой из следующих причин:

  1. Доступно новое обновление, и пользователь не активировал экземпляр обновления; или
  2. Последнее обновление завершилось сбоем, и пользователь не активировал другой экземпляр обновления.

Разрешение. Активация экземпляра обновления.

Проблема: обновление завершается сбоем после нескольких повторных попыток

Решение. Чтобы устранить проблему, обратитесь в службу поддержки Майкрософт.

Проблема: Обновление завершается ошибкой, и откат приводит к несогласованному состоянию, когда количество виртуальных машин в экземпляре Масштабируемых Наборов Виртуальных Машин изменено.

Разрешение. Перейдите в консоль System Center Operations Manager и удалите несогласованные узлы.

Проблема. Обновление завершается сбоем, но обновление базы данных успешно завершено

Причина. Происходит из-за сбоя обновления после успешного обновления базы данных.

Разрешение: повторите попытку через некоторое время.

Проблема. После успешного обновления консоль System Center Operations Manager работает неправильно в экземпляре.

Причина. Возникает, если System Center Operations Manager не установлен должным образом или некоторый процесс может застрять.

Решение: Попробуйте перезапустить экземпляр. Если проблема сохранится, обратитесь в службу поддержки клиентов Майкрософт.

Проблема. Обновление занимает более 3 часов и завершается сбоем в конечном итоге

Причина. Происходит, когда обновление занимает более 3 часов.

Решение. Обратитесь в службу поддержки Майкрософт.

Проблема. Некоторые периодические проблемы во время обновления

Причина: возникает, если service fabric или RP завершает работу или перезапускается.

Решение: Перезапустите обновление.

Проблема: Масштабирование и патчинг инициированы одновременно и приводят к сбою.

Причина. Происходит, если запросы на масштабирование и исправление отправляются и принимаются одновременно.

Решение. Если вы активировали операцию масштабирования, дождитесь завершения операции перед попыткой обновить операцию.

Проблема: расширение обновляется дольше и не удаётся.

Причина: Происходит, если Управляемый экземпляр SQL и SCOM находятся в разных регионах, вследствие чего расширению требуется больше времени на обновление и в конечном итоге обновление завершается сбоем.

Решение: Управляемые экземпляры SQL и SCOM должны находиться в одном регионе.

Проблема. После исправления пользовательские данные в базе данных изменяются или не сохраняются должным образом.

Причина. Происходит, если обновление не было выполнено должным образом.

Решение: Перезапустите обновление.

Проблема: неудача запроса на патч

Причина. Возникает из-за проблемы с порталом или ARM.

Решение: подождите некоторое время и повторите попытку. Если проблема существует даже после устранения проблемы с порталом или ARM, обратитесь в службу поддержки Майкрософт.

Проблема: операция исправления или масштабирования уже выполняется, повторите попытку через некоторое время.

Причина. Происходит, если операция исправления или масштабирования уже выполняется.

Решение. Дождитесь завершения существующей операции и попробуйте через некоторое время.

Проблема: устаревшие серверы управления, видимые на консоли

Причина. Возникает, если операция исправления или масштабирования оставила несогласованное состояние после завершения.

Решение: Масштабируемый набор виртуальных машин Microsoft Azure используется для подготовки серверов управления к управляемым экземплярам SCOM. Чтобы удалить устаревший сервер управления из системы, выполните следующие действия.

  1. Перейдите к масштабируемым наборам виртуальных машин Azure и войдите на один из серверов управления для управляемого экземпляра SCOM.

  2. Запустите PowerShell в административном режиме и перейдите к следующему каталогу.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Примечание.

    Чтобы найти версию, перейдите по ссылке C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows, просмотрите все доступные версии и выберите последнюю.

  3. Выполните следующий скрипт:

    .\RemoveStaleManagementServers.ps1 
    

    Скрипт является интерактивным и запрашивает полное доменное имя устаревшего сервера.

  4. Укажите точное полное доменное имя устаревшего сервера управления, который вы хотите удалить.

    Например, полное доменное имя: SCOMMI2000001.contoso.com.