Рекомендации по проектированию пула ресурсов

Важно!

Поддержка этой версии Operations Manager завершена. Рекомендуется выполнить обновление до Operations Manager 2022.

Пул ресурсов — это логическое объединение серверов управления или серверов шлюзов, которые распределяют между собой рабочие нагрузки и принимают на себя рабочие нагрузки в случае сбоя одного из членов. Другими словами, они обеспечивают высокую доступность и масштабируемость рабочих процессов. При разработке группы управления необходимо уделить особое внимание мониторингу сетевых устройств, систем Linux и UNIX, а также других рабочих нагрузок, которые будут пользоваться пулом ресурсов.

Обзор

Пулы ресурсов обеспечивают непрерывность наблюдения благодаря использованию нескольких элементов, то есть серверов управления и (или) серверов шлюзов, которые принимают на себя рабочие процессы наблюдения, если один из элементов становится недоступен. Можно создавать пулы ресурсов для определенных целей. Например, можно создать пул ресурсов, состоящий из серверов управления, которые расположены в основном центре обработки данных, для наблюдения за сетевыми устройствами.

Пулы ресурсов применяют логику, аналогичную кластеризации набора основных узлов, где (<число узлов, функционирующих в качестве членов пула>/2) + 1. Как минимум, в пуле ресурсов должны быть три участника для поддержки кворума: чтобы пул имел кворум и был доступен, требуется не менее 50 % участников. Если у вас есть только два члена пула и один из них недоступен, вы потеряли кворум.

Для каждого пула ресурсов, созданного в консоли управления, база данных Operations Manager, которая называется наблюдателем по умолчанию, всегда получает голос, даже если в пуле есть четное число членов, чтобы разрешить доступ кворуму. Это также относится к трем пулам ресурсов, созданным по умолчанию при первом создании группы управления, что рассматривается далее в этой статье. Для всех пулов ресурсов, создаваемых с помощью командлета PowerShell NewSCOM-ResourcePool, эта база данных по умолчанию отключена. Включение базы данных Operations Manager в качестве наблюдателя по умолчанию снижает сложность группы управления благодаря тому, что для обеспечения высокой доступности пулов ресурсов достаточно развернуть два сервера управления.

Еще одна роль, обеспечивающая работу пулов ресурсов, — наблюдатели. Это сервер управления или сервер шлюза, который не участвует в рабочих процессах загрузки пула; однако они участвуют в решениях кворума. В обычных условиях он не используется, поэтому принимать его во внимание нет необходимости.

Существует два типа членства:

  • Автоматически
  • Вручную

При создании пула ресурсов для него настроено участие вручную, и изменить это значение на "Автоматически" невозможно. При создании группы управления System Center Operations Manager три пула ресурсов создаются по умолчанию с автоматическим участием. В следующей таблице описаны эти три пула ресурсов.

Имя пула ресурсов Описание
пул ресурсов "Все серверы управления"; Выполняет рабочие процессы для групповых вычислений, доступности, сводного показателя работоспособности распределенного мониторинга и очистки базы данных.
пул ресурсов уведомлений; Рабочие процессы службы подписки на предупреждения ориентированы на этот пул ресурсов, чтобы обеспечить поддержку уведомлений о предупреждениях.
пул ресурсов назначения Active Directory. Рабочие процессы интеграции AD ориентированы на этот пул ресурсов, чтобы обеспечить автоматическое назначение агентов серверам управления.

Так как участие в пуле ресурсов всех серверов управления является автоматическим, любой вводимый в эксплуатацию сервер управления автоматически становится участником этого пула ресурсов. Для некоторых архитектур и особенностей проектирования, таких как реализация географически распределенных аварийных операций, автоматическое назначение для пула ресурсов всех серверов управления может оказаться нежелательным. В таких случаях можно изменить назначение участия с автоматического на ручное. Таким образом, серверы управления должны добавляться в пул ресурсов всех серверов управления через назначение вручную.

Примечание

Параметр членства в пуле ресурсов всех серверов управления имеет атрибут "только для чтения". Чтобы изменить участие с автоматического на ручное, выполните инструкции в разделе Изменение участия в пуле.

С появлением пулов ресурсов рекомендуется, чтобы все члены были подключены к сети с низкой задержкой (менее 10 мс). Пулы ресурсов не следует развертывать в нескольких центрах обработки данных или в гибридной облачной среде, такой как Microsoft Azure.

Примеры доступности пула ресурсов

В приведенных ниже примерах демонстрируется понятие доступности пула ресурсов на основе следующих конфигураций: только с серверами управления или только с серверами шлюза.

Один сервер управления

  • Наблюдатель по умолчанию включен, но не имеет смысла, так как участников только два и кворума нет.
  • Высокий уровень доступности отсутствует, так как сервер управления является единой точкой отказа.

Два сервера управления

  • Наблюдатель по умолчанию включен.
  • Существует высокий уровень доступности для пула, так как имеется три участника, голосующих : два сервера управления и наблюдатель по умолчанию.
  • Если отключить наблюдатель по умолчанию, высокая доступность пропадет.

Три сервера управления

  • Наблюдатель по умолчанию включен.
  • Существует высокий уровень доступности для пула, так как имеется четыре участника голосования : три сервера управления и наблюдатель по умолчанию.
  • По умолчанию кворум сохраняется, если станет недоступен один сервер управления, но не более. Если два сервера управления недоступны, у вас есть ровно 50 % участников, голосующих, и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию не увеличивает число серверов управления, которые могут быть недоступны, и поэтому не влияет на доступность пула.
  • В такой ситуации наблюдатель по умолчанию можно удалить.

Четыре сервера управления

  • Наблюдатель по умолчанию включен.
  • Существует высокий уровень доступности для пула, так как имеется пять участников голосования — четыре сервера управления и наблюдатель по умолчанию.
  • По умолчанию кворум сохраняется, если станут недоступны два сервера управления. Если три сервера управления отключены, у вас менее 50 % участников, голосующих, и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию в такой ситуации полезен, так как увеличивает количество серверов управления, которые могут быть недоступны. Без наблюдателя по умолчанию в кворум входили бы только четыре участника и допускалось бы отключение только одного из них.

Пять серверов управления

  • Наблюдатель по умолчанию включен.
  • Существует высокий уровень доступности для пула, так как имеется шесть участников, голосующих : пять серверов управления и наблюдатель по умолчанию.
  • По умолчанию кворум сохраняется, если станут недоступны два сервера управления, но не более. Если недоступными станут три сервера, участников, имеющих голоса, будет ровно 50 % и пул ресурсов больше не будет управлять рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию не увеличивает число серверов управления, которые могут быть недоступны, и поэтому не влияет на доступность пула.
  • В такой ситуации наблюдатель по умолчанию можно удалить.

Когда вы достигнете трех или более серверов управления в пуле ресурсов, где в пуле имеется нечетное число членов, вы можете удалить наблюдателя по умолчанию в качестве члена. Если вы достигнете пяти серверов управления, существует вероятность того, что операционная база данных будет испытывать значительную нагрузку, что может привести к достаточной задержке, чтобы повлиять на вычисления пула ресурсов.

Из-за особенностей работы наблюдателя по умолчанию каждый сервер управления в пуле выполняет запрос к собственной локальной службе SDK, что позволяет ему запрашивать наблюдатель по умолчанию в таблице в рабочей базе данных. Если служба SDK или база данных находится под нагрузкой, возникнет задержка, которой в противном случае не было бы.

Один сервер шлюза

  • Наблюдатель по умолчанию включен.
  • Высокий уровень доступности отсутствует, так как сервер шлюза является единой точкой отказа.
  • Здесь не следует использовать наблюдатель по умолчанию , так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.

Два сервера шлюза

  • Наблюдатель по умолчанию включен.
  • Высокий уровень доступности отсутствует, так как в пуле есть только два члена, а наблюдатель по умолчанию не является участником, так как серверы шлюза не взаимодействуют напрямую с операционной базой данных. Для обеспечения кворума пула требуются три сервера шлюза.

Три сервера шлюза

  • Наблюдатель по умолчанию включен.
  • Существует высокий уровень доступности пула, так как имеется три члена, голосующих — три сервера шлюза.
  • По умолчанию для поддержания кворума недоступен только один сервер шлюза. Если недоступными станут два сервера шлюза, участников, имеющих голоса, будет менее 50 % и пул ресурсов больше не будет управлять рабочими нагрузками мониторинга.
  • Здесь не следует использовать наблюдатель по умолчанию , так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.

Мониторинг сценариев с поддержкой пулов ресурсов

Следующие рабочие процессы размещаются пулами ресурсов в Operations Manager:

  • Управление сетевыми устройствами
  • Управление агентами UNIX/Linux
  • Мониторинг URL-адресов веб-приложения

Примечание

Агенты Windows не подчиняются пулам ресурсов.

Мониторинг сети в Operations Manager требует собственного выделенного пула. Это объясняется тем, что рабочие процессы сетевого мониторинга работают на серверах управления (в модуле SNMP), а не в агентах. В результате на серверы управления ложится большая нагрузка, когда вы включаете мониторинг сетевых портов, особенно если выбрать большинство активных портов, доступных на устройстве. Таким образом, для улучшения производительности рекомендуется использовать для мониторинга сети выделенные серверы управления в выделенных пулах ресурсов. Кроме того, серверы управления, которые являются участниками этого пула, не должны удаляться из пулов "Все серверы управления", "Уведомления" и "Назначение AD".

Мониторинг систем Linux и UNIX в Operations Manager может быть назначен выделенному пулу ресурсов, если требуется включить мониторинг высокой доступности и управление агентами, однако это необязательно. Operations Manager использует сертификаты для проверки подлинности доступа к компьютерам, которые он управляет. Когда мастер обнаружения развертывает агент, он получает от агента сертификат, подписывает его, возвращает сертификат агенту и перезапускает его. Для обеспечения высокой доступности на каждом сервере управления в пуле ресурсов должны присутствовать все корневые сертификаты, которые используются для подписания сертификатов, развертываемых на агентах на компьютерах UNIX и Linux. В противном случае, если сервер управления становится недоступным, другие серверы управления не смогут доверять сертификатам, подписанным сервером, на который произошел сбой.

Дальнейшие действия

Сведения о создании пулов ресурсов и управлении ими см. в разделе Управление пулами ресурсов.