Поделиться через


Решение "Работоспособность агентов" в Azure Monitor

Решение "Работоспособность агентов" в Azure помогает понять, какие агенты мониторинга не отвечают и отправляют операционные данные. Сюда относятся все агенты, которые отправляют отчеты непосредственно в рабочую область Log Analytics в Azure Monitor или в группу управления Operations Manager System Center, подключенную к Azure Monitor.

Вы также можете использовать решение "Работоспособность агентов" для выполнения следующих задач:

  • Контроль числа развернутых агентов и их географического распределения.
  • Выполнение других запросов, позволяющих отслеживать распределение агентов, развернутых в Azure, других облачных средах или в локальной среде.

Внимание

Решение "Работоспособность агента" отслеживает только работоспособность агента Log Analytics, который устарел с 31 августа 2024 года. Это решение не отслеживает работоспособность агента Azure Monitor.

Необходимые компоненты

Перед развертыванием этого решения убедитесь, что у вас есть поддерживаемые агенты Windows, которые отправляют отчеты в рабочую область Log Analytics или группу управления Operations Manager, интегрированную с вашей рабочей областью.

Пакеты управления

Если группа управления Operations Manager подключена к рабочей области Log Analytics, в Operations Manager будут установлены следующие пакеты. Эти пакеты управления также устанавливаются непосредственно на подключенных компьютерах Windows после добавления этого решения:

  • Пакет аналитики канала Direct оценки работоспособности помощника Microsoft System Center (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Управление и настройка здесь не требуются. Дополнительные сведения об обновлении пакетов управления для решений см. в статье Подключение Operations Manager к Log Analytics.

Настройка

Добавьте решение для мониторинга работоспособности агентов в рабочую область Log Analytics, как описано в статье Добавление решений. Дальнейшая настройка не требуется.

Поддерживаемые агенты

В приведенной ниже таблице описаны подключенные источники, которые поддерживает это решение.

Подключенный источник Поддерживается Description
Агенты Windows Да События пульса собираются от прямых агентов Windows.
Группа управления System Center Operations Manager Да События пульса собираются из агентов, которые передаются в группу управления каждые 60 секунд, а затем пересылаются в Azure Monitor. Прямое подключение агентов Operations Manager к Azure Monitor не требуется. Данные событий пульса перенаправляются из группы управления в рабочую область Log Analytics.

Использование решения

При добавлении решения в рабочую область Log Analytics на панель мониторинга добавляется плитка Работоспособность агентов. На ней отображается общее число агентов и число агентов, не отвечающих на запросы за последние 24 часа.

Снимок экрана: плитка работоспособности агента на панели мониторинга.

Щелкните плитку Работоспособность агентов, чтобы открыть панель мониторинга Работоспособность агентов. Панель мониторинга содержит столбцы, перечисленные в приведенной ниже таблице. Каждый столбец содержит по десять основных событий, соответствующих таким указанным критериям, как диапазон времени. Вы можете выполнить поиск по журналам, предоставляющий весь список. Выберите "Просмотреть все " под каждым столбцом или выберите заголовок столбца.

Столбец Description
Число агентов по времени Тенденция изменения числа агентов в течение семи дней для агентов Linux и Windows.
Число агентов, не отвечающих на запросы Список агентов, которые не отправили пакеты пульса за последние 24 часа.
Распределение по типам ОС Число агентов Windows и Linux в вашей среде.
Распределение по версиям агентов Другие версии агентов, установленные в вашей среде, и их число.
Распределение по категориям агентов Различные категории агентов, отправляющих события пульса: прямые агенты, агенты Operations Manager и сервер управления Operations Manager.
Распределение по группам управления Разные группы управления Operations Manager в вашей среде.
Географическое расположение агентов Разные страны или регионы, в которых находятся ваши агенты, и общее число агентов, установленных в каждой стране или регионе.
Число установленных шлюзов Число серверов, на которых установлен шлюз Log Analytics, и список этих серверов.

Снимок экрана: пример панели мониторинга решения

Записи журнала Azure Monitor

Решение создает один тип записи в рабочей области Log Analytics: пакет пульса. Записи пульса содержат свойства, перечисленные в следующей таблице.

Свойство Description
Type Heartbeat
Category Direct Agent, SCOM Agent или SCOM Management Server
Computer Имя компьютера
OSType Операционная система Windows или Linux.
OSMajorVersion Основная версия операционной системы.
OSMinorVersion Второстепенная версия операционной системы.
Version Версия агента Log Analytics или агента Operations Manager.
SCAgentChannel Direct и (или) SCManagementServer
IsGatewayInstalled true, если установлен шлюз Log Analytics; в противном случае false
ComputerIP Общедоступный IP-адрес для виртуальной машины Azure, если он доступен; адрес Azure SNAT (не частный IP-адрес) для виртуальной машины, использующей частный IP
ComputerPrivateIPs Список частных IP-адресов компьютера.
RemoteIPCountry Географическое расположение, в котором развернут компьютер.
ManagementGroupName Имя группы управления Operations Manager
SourceComputerId Уникальный идентификатор компьютера
RemoteIPLongitude Долгота географического расположения компьютера
RemoteIPLatitude Широта географического расположения компьютера

Каждый агент, отправляющий отчеты на сервер управления Operations Manager, будет отправлять два пакета пульса. Значение свойства SCAgentChannel будет включать Direct и SCManagementServer в зависимости от того, какие источники данных и решения по мониторингу включены в вашей подписке.

При отзыве отправляются данные из решений:

  • Непосредственно с сервера управления Operations Manager в Azure Monitor.
  • Непосредственно из агента в Azure Monitor из-за объема данных, собранных на агенте.

Для событий пульса со значением SCManagementServer значением ComputerIP является IP-адрес сервера управления, так как он фактически передает данные. Для пульсов со значением Direct для параметра SCAgentChannel IP-адрес компьютера — это общедоступный IP-адрес агента.

Примеры поиска по журналам

Следующая таблица содержит примеры поисков по журналу для получения записей, собранных этим решением.

Query Description
Heartbeat | distinct Computer Общее число агентов
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) Число агентов, не отвечающих на запросы за последние 24 часа
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(15m) Число агентов, не отвечающих на запросы за последние 15 минут
Heartbeat | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Подключенные компьютеры (за последние 24 часа)
Heartbeat | where TimeGenerated > ago(24h) and Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Общее число автономных агентов за последние 30 минут (за последние 24 часа)
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Тенденция изменения числа агентов за промежуток времени по типу ОС
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Распределение по типам ОС
Heartbeat | summarize AggregatedValue = dcount(Computer) by Version Распределение по версиям агентов
Heartbeat | summarize AggregatedValue = count() by Category Распределение по категориям агентов
Heartbeat | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Распределение по группам управления
Heartbeat | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Географическое расположение агентов
Heartbeat | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Число установленных шлюзов Log Analytics

Следующие шаги

Подробнее о создании оповещений из запросов журналов в Azure Monitor.