Поделиться через


Рекомендации по проектированию пула ресурсов

Пул ресурсов — это логическая группировка серверов управления и (или) серверов шлюзов, используемых для распределения работы между собой и принятия на себя работы с неработоченным членом. Иными словами, они обеспечивают высокую доступность и масштабируемость рабочих процессов. При разработке группы управления необходимо учитывать мониторинг сетевых устройств, систем Linux/UNIX и других рабочих нагрузок, предполагающих использование пула ресурсов.

Обзор

Пулы ресурсов обеспечивают непрерывность мониторинга, предоставляя нескольким членам, которые являются серверами управления и (или) серверами шлюзов, которые могут взять на себя рабочие процессы мониторинга, если один из членов пула становится недоступным. Можно создавать пулы ресурсов для определенных целей. Например, можно создать пул ресурсов серверов управления в основном центре обработки данных для мониторинга сетевых устройств.

Пулы ресурсов применяют логику, аналогичную кластеризации набора основных узлов, где (<число узлов, функционирующих в качестве членов пула>/2) + 1. Как минимум, в пуле ресурсов должны быть три участника для поддержки кворума: чтобы пул имел кворум и был доступен, требуется не менее 50 % участников. Если у вас есть только два члена пула, и один недоступен, вы потеряли кворум.

Для каждого пула ресурсов, созданного в консоли управления, база данных Operations Manager, которая называется наблюдателем по умолчанию, всегда получает голосование, даже если у вас есть даже количество членов в пуле, чтобы разрешить кворум быть достигнут. Это также относится к трем пулам ресурсов, созданным по умолчанию при первом создании группы управления, которая рассматривается далее в этой статье. Для всех пулов ресурсов, созданных с помощью командлета PowerShell NewSCOM-ResourcePool, он по умолчанию отключен. Включение базы данных Operations Manager в качестве наблюдателя по умолчанию снижает сложность группы управления, только требуя развертывания двух серверов управления как минимум для обеспечения высокой доступности пулов ресурсов.

Другая роль, поддерживающая пул ресурсов, — наблюдатели. Это сервер управления или сервер шлюза, который не участвует в загрузке рабочих процессов для пула; однако они участвуют в решениях кворума. Это никогда не используется в обычных обстоятельствах, поэтому не следует рассматривать.

Существует два типа членства:

  • Автоматически
  • Руководство

При создании пула ресурсов его членство устанавливается вручную и не может быть перенастроено на автоматически. При создании группы управления System Center — Operations Manager три пула ресурсов создаются по умолчанию с автоматическим членством. В следующей таблице описаны три пула ресурсов.

Имя пула ресурсов Description
Пул ресурсов всех серверов управления Выполняет рабочие процессы для вычисления групп, доступности, свертки работоспособности распределенного монитора и очистки базы данных.
Пул ресурсов уведомлений Рабочие процессы службы подписки оповещений предназначены для этого пула ресурсов для поддержки уведомлений об оповещениях.
Пул ресурсов назначения AD Рабочие процессы интеграции AD предназначены для этого пула ресурсов для поддержки автоматического назначения агента серверам управления.

Так как членство в пуле ресурсов "Все серверы управления" является автоматическим, любой сервер управления, который выполняется по заказу, автоматически становится членом этого пула ресурсов. В некоторых архитектурах и рекомендациях по проектированию, таких как включение географически распределенных операций на непредвиденные случаи, автоматическое назначение пулу ресурсов всех серверов управления может не потребоваться. В таких ситуациях можно изменить назначение членства с автоматического на ручное. Таким образом, серверы управления должны быть добавлены в пул ресурсов всех серверов управления с помощью назначения вручную.

Примечание.

Параметр членства в пуле ресурсов всех серверов управления имеет атрибут "только для чтения". Сведения об изменении членства с автоматического на ручное см. в разделе "Изменение членства в пуле".

При внедрении пулов ресурсов рекомендуется, чтобы все члены были подключены к сети с низкой задержкой (менее 10 мс). Пулы ресурсов не следует развертывать в нескольких центрах обработки данных или в гибридной облачной среде, такой как Microsoft Azure.

Примеры доступности пула ресурсов

В следующих примерах демонстрируется концепция доступности пула ресурсов на основе следующих конфигураций, только с серверами управления или только с серверами шлюза.

Единый сервер управления

  • Наблюдатель по умолчанию включен по умолчанию и не предоставляет преимущества, так как не достигнут только два члена и кворум.
  • Высокий уровень доступности отсутствует, так как сервер управления является одной точкой сбоя.

Два сервера управления

  • Наблюдатель по умолчанию включен по умолчанию.
  • Существует высокий уровень доступности для пула, так как существует три члена голосования - два сервера управления и наблюдатель по умолчанию.
  • Если отключить наблюдатель по умолчанию, вы потеряете высокий уровень доступности для пула.

Три сервера управления

  • Наблюдатель по умолчанию включен по умолчанию.
  • Существует высокий уровень доступности для пула, так как существует четыре члена голосования - три сервера управления и наблюдатель по умолчанию.
  • По умолчанию для обслуживания кворума можно использовать только один сервер управления. Если два сервера управления недоступны, то у вас ровно 50% участников голосования и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию не увеличивает количество серверов управления, которые могут быть отключены, поэтому он не увеличивает доступность пула.
  • В этом сценарии можно удалить наблюдателя по умолчанию.

Четыре сервера управления

  • Наблюдатель по умолчанию включен по умолчанию.
  • Существует высокий уровень доступности для пула, так как есть пять членов голосования - четыре сервера управления и наблюдатель по умолчанию.
  • По умолчанию кворум сохраняется, если станут недоступны два сервера управления. Если три сервера управления отключены, у вас менее 50% участников голосования и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию в этом сценарии имеет значительное значение, так как он увеличивает количество серверов управления, которые могут быть отключены. Без наблюдателя по умолчанию у вас будет только четыре члена кворума, что позволяет только одному участнику быть недоступным.

Пять серверов управления

  • Наблюдатель по умолчанию включен по умолчанию.
  • Существует высокий уровень доступности для пула, так как есть шесть членов голосования - пять серверов управления и наблюдатель по умолчанию.
  • По умолчанию для обслуживания кворума можно использовать только два сервера управления. Если три сервера управления недоступны, это ровно 50% членов голосования, а пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию не увеличивает количество серверов управления, которые могут быть отключены, поэтому он не увеличивает доступность пула.
  • В этом сценарии можно удалить наблюдателя по умолчанию.

Когда вы достигнете трех или более серверов управления в пуле ресурсов, где у вас есть нечетное количество участников в пуле, можно рассмотреть возможность удаления наблюдателя по умолчанию в качестве члена. Если вы достигнете пяти серверов управления, существует потенциал для операционной базы данных, которая может привести к значительной нагрузке, что может привести к достаточной задержке, чтобы повлиять на вычисления пула ресурсов.

Так как наблюдатель по умолчанию играет роль, каждый сервер управления в пуле запрашивает собственную локальную службу SDK, которая позволяет запрашивать таблицу в операционной базе данных для наблюдателя по умолчанию. Если служба SDK или база данных находится под нагрузкой, возникнет задержка, которой в противном случае не было бы.

Один сервер шлюза

  • Наблюдатель по умолчанию включен по умолчанию.
  • Высокий уровень доступности отсутствует, так как сервер шлюза является одной точкой сбоя.
  • Наблюдатель по умолчанию не должен использоваться здесь, так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.

Два сервера шлюза

  • Наблюдатель по умолчанию включен по умолчанию.
  • Высокий уровень доступности отсутствует, так как существует только два члена пула, а наблюдатель по умолчанию не является участником, так как серверы шлюзов напрямую не взаимодействуют с операционной базой данных. Для поддержания кворума пула требуются три сервера шлюза.

Три сервера шлюза

  • Наблюдатель по умолчанию включен по умолчанию.
  • Существует высокий уровень доступности для пула, так как существует три члена голосования - три сервера шлюза.
  • По умолчанию для обслуживания кворума можно использовать только один сервер шлюза. Если два сервера шлюза отключены, это менее 50% членов голосования, а пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
  • Наблюдатель по умолчанию не должен использоваться здесь, так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.

Сценарии мониторинга, поддерживающие пулы ресурсов

Следующие рабочие процессы размещаются пулами ресурсов в Operations Manager:

  • Управление сетевыми устройствами
  • Управление агентами UNIX и Linux
  • Мониторинг URL-адресов веб-приложения

Примечание.

Агенты Windows не сообщают пулам ресурсов.

Для мониторинга сети в Operations Manager требуется отдельный выделенный пул ресурсов. Это связано с тем, что рабочие процессы мониторинга сети выполняются на серверах управления (в модуле SNMP), а не на агентах. Это позволяет установить тяжелую нагрузку на серверы управления после включения мониторинга сетевых портов, особенно при выборе большинства активных портов, доступных на устройстве. Поэтому для повышения производительности рекомендуется использовать выделенные серверы управления в выделенных пулах ресурсов для мониторинга сети. Кроме того, серверы управления, которые являются членами этого пула, должны быть удалены из пулов назначений всех серверов управления, уведомлений и AD.

При необходимости мониторинг Linux и UNIX в Operations Manager можно назначать выделенному пулу ресурсов, чтобы включить мониторинг высокого уровня доступности и управление агентами, но не требуется. Operations Manager использует сертификаты для проверки подлинности доступа к компьютерам, которые он управляет. Когда мастер обнаружения развертывает агент, он получает от агента сертификат, подписывает его, возвращает сертификат агенту и перезапускает его. Для обеспечения высокой доступности каждый сервер управления в пуле ресурсов должен иметь все корневые сертификаты, которые используются для подписывания сертификатов, развернутых на агентах на компьютерах UNIX и Linux. В противном случае, если сервер управления становится недоступным, другие серверы управления не смогут доверять сертификатам, подписанным сервером, который завершился сбоем.

Следующие шаги

Сведения о создании пулов ресурсов и управлении ими см. в статье "Управление пулами ресурсов".