Мониторинг одного кластера Azure Stack HCI версии 23H2 с помощью Insights

Применимо к: Azure Stack HCI версии 23H2

В этой статье описывается, как использовать Аналитику для мониторинга одного кластера Azure Stack HCI. Сведения о нескольких кластерах Azure Stack HCI см. в статье Мониторинг нескольких кластеров Azure Stack HCI с помощью Аналитики.

Аналитика — это функция Azure Monitor, которая позволяет быстро приступить к мониторингу кластера Azure Stack HCI. Вы можете просматривать ключевые метрики, сведения о работоспособности и использовании кластера, серверов, виртуальных машин и хранилища.

Укажите несколько минут, чтобы watch пошаговое руководство по аналитическим сведениям для Azure Stack HCI:

Преимущества

Аналитика для Azure Stack HCI предлагает следующие преимущества:

  • Управляется Azure. Служба Insights управляется Azure и доступна через портал Azure, гарантируя, что она всегда актуальна. Нет необходимости в настройке базы данных или специального программного обеспечения.

  • масштабируемость; Аналитика может одновременно загружать более 400 наборов сведений о кластере в нескольких подписках. Нет никаких ограничений на кластер, домен или физическое расположение.

  • Возможность настройки. Аналитический интерфейс основан на шаблонах книг Azure Monitor. Это позволяет изменять представления и запросы, изменять или устанавливать пороговые значения, которые соответствуют определенным ограничениям, а затем сохранять эти настройки в книге. Затем можно закрепить диаграммы в книгах на панелях мониторинга Azure.

Предварительные требования

Ниже приведены предварительные требования к использованию Insights для Azure Stack HCI.

  • У вас должен быть доступ к развернутым и зарегистрированным кластеру Azure Stack HCI.

  • Необходимо включить управляемое удостоверение для ресурса Azure. Дополнительные сведения см. в разделе Включение расширенного управления.

Включение аналитики

Включение Аналитики помогает отслеживать все кластеры Azure Stack HCI, которые в настоящее время связаны с рабочей областью Log Analytics, предоставляя полезные метрики работоспособности. Аналитика устанавливает агент Azure Monitor и помогает настроить правила сбора данных (DCR) для мониторинга кластера Azure Stack HCI.

Выполните следующие действия, чтобы включить Аналитику из портал Azure.

  1. В портал Azure перейдите на страницу ресурса кластера Azure Stack HCI и выберите кластер. На вкладке Возможности выберите Аналитика.

    Снимок экрана: плитка

  2. На странице Аналитика выберите Начало работы.

    Снимок экрана: кнопка

  3. На странице Конфигурация Аналитики выберите существующий DCR в раскрывающемся списке Правило сбора данных . DCR указывает журналы событий и счетчики производительности, которые необходимо собрать, и сохраняет их в рабочей области Log Analytics. Аналитика создает DCR по умолчанию, если он еще не существует. Включены только DCR, включенные для Аналитики.

    Снимок экрана: окно конфигурации Аналитики.

  4. (Необязательно) Вы также можете создать DCR, выбрав Create Создать на странице конфигурации Аналитики.

    Важно!

    Настоятельно рекомендуем не создавать собственные DCR. DCR, созданный Аналитикой, включает в себя специальный поток данных, необходимый для его работы. Вы можете изменить этот DCR для сбора дополнительных данных, таких как события Windows и системного журнала. DCR, созданные с помощью установки AMA, будут иметь префикс AzureStackHCI- , присоединенный к имени DCR.

    1. На странице Новое правило сбора данных укажите подписку, имя DCR и имя конечной точки сбора данных (DCE). DcEs используются для доступа к службе конфигурации для получения связанных DCR для агента Azure Monitor. Дополнительные сведения о DCE см. в статье Конечные точки сбора данных в Azure Monitor.

      Примечание

      Если вы используете приватные каналы в агенте, необходимо добавить dces. Дополнительные сведения о параметрах сети AMA см. в статье Определение параметров сети агента Azure Monitor.

      Снимок экрана: окно правила сбора данных.

    2. Нажмите кнопку Просмотреть и создать.

      Если DCR еще не создан для неотслеживаемого кластера, он создается с включенными счетчиками производительности и включенным каналом журнала событий Windows.

  5. Просмотрите последний экран со сводкой имени DCR, количества журналов событий, счетчиков производительности и имени рабочей области Log Analytics, в которой хранятся данные. Выберите Настроить.

    Снимок экрана: раскрывающийся список правил сбора данных.

    После выбора настройки вы будете перенаправлены на страницу Расширения, где можно просмотреть состояние установки агента. При настройке Аналитики AMA автоматически устанавливается на всех узлах кластера.

  6. Перейдите на страницу ресурса кластера Azure Stack HCI и выберите кластер. Аналитика теперь отображается как Настроено на вкладке Возможности :

    Снимок экрана: плитка Аналитика настроена.

Правила сбора данных

При включении Аналитики на компьютере с агентом Azure Monitor необходимо указать DCR для использования. Дополнительные сведения о DCR см. в статье Правила сбора данных в Azure Monitor.

Параметр Описание
Счетчики производительности Указывает, какие счетчики производительности данных должны собираться из операционной системы. Этот параметр является обязательным для всех компьютеров. Эти счетчики производительности используются для заполнения визуализаций в книге Insights. В настоящее время книга Insights использует пять счетчиков производительности : Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/secи RDMA Activity()\RDMA Outbound Bytes/sec
Канал журнала событий Указывает, какие журналы событий Windows следует собирать из операционной системы. Этот параметр является обязательным для всех компьютеров. Журналы событий Windows используются для заполнения визуализаций в книге Insights. В настоящее время данные собираются через два канала журнала событий Windows: - microsoft-windows-health/operational и microsoft-windows-sddc-management/operational
Рабочая область Log Analytics Рабочая область для хранения данных. В списке указаны только рабочие области с Аналитикой.

Канал событий

Канал Microsoft-windows-sddc-management/operational событий и Microsoft-windows-health/operational Windows добавляются в рабочую область Log Analytics в разделе Журналы событий Windows.

Снимок экрана: окно добавления источника данных.

Собирая эти журналы, Аналитика отображает состояние работоспособности отдельных серверов, дисков, томов и виртуальных машин. По умолчанию добавляются пять счетчиков производительности.

Счетчики производительности

По умолчанию добавляются пять счетчиков производительности:

Снимок экрана: добавленные счетчики производительности.

В следующей таблице описаны отслеживаемые счетчики производительности.

Счетчики производительности Описание
Memory(*)\Available Bytes Доступные байты — это объем физической памяти в байтах, немедленно доступный для выделения процессу или для использования системой.
Сетевой интерфейс(*)\Всего байт/с Скорость отправки и получения байтов через каждый сетевой адаптер, включая символы обрамления. Всего байт/с — это сумма полученных байт/с и отправленных байтов в секунду.
Процессор(_Total)% процессорного времени Процент затраченного времени, когда все потоки процесса использовали процессор для выполнения инструкций.
RDMA Activity(*)\RDMA Inbound Bytes/sec Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду.
RDMA Activity(*)\RDMA Outbound Bytes/sec Скорость передачи данных через RDMA сетевым адаптером в секунду.

После включения Insights сбор данных может занять до 15 минут. После завершения процесса вы сможете увидеть полнофункционалную визуализацию работоспособности кластера в меню Аналитика на панели слева:

Снимок экрана: визуализации аналитических сведений.

Отключение аналитики

Чтобы отключить Аналитику, выполните следующие действия.

  1. Выберите Аналитика на вкладке Возможности .

  2. Выберите Отключить аналитику.

    Снимок экрана: окно

При отключении функции Аналитики связь между правилом сбора данных и кластером удаляется, а журналы службы работоспособности и управления SDDC больше не собираются; однако существующие данные не удаляются. Если вы хотите удалить эти данные, перейдите в рабочую область DCR и Log Analytics и удалите данные вручную.

Обновление аналитики

На плитке Аналитика отображается сообщение Требуется обновление в следующих случаях:

  • Изменено правило сбора данных.
  • Событие работоспособности из журнала событий Windows удаляется.
  • Любой из пяти счетчиков производительности из рабочей области Log Analytics удаляется.

Чтобы снова включить Аналитику, выполните следующие действия.

  1. Выберите плитку Аналитика в разделе Возможности.

  2. Выберите Обновить , чтобы снова просмотреть визуализации.

    Снимок экрана: окно

Диагностика

В этом разделе приведены рекомендации по устранению проблем с использованием Insights для Azure Stack HCI.

Устранение неполадок пустой страницы книг без заполнений данных

Проблема. Вы увидите пустую страницу книг без заполненных данных, как показано на следующем снимке экрана:

Снимок экрана: пустая страница книг.

Возможные причины. Эта проблема может быть вызвана несколькими причинами, например недавней конфигурацией Insights или неправильной конфигурацией связанного DCR.

Решение. Чтобы устранить эту проблему, последовательно выполните следующие действия.

  1. Если вы недавно настроили Аналитику, подождите до одного часа, пока AMA соберет данные.
  2. Проверьте конфигурацию связанного DCR. Убедитесь, что каналы событий и счетчики производительности добавлены в качестве источников данных в связанный DCR, как описано в разделе Правила сбора данных .
  3. Если проблема сохраняется после выполнения описанных выше действий и вы по-прежнему не видите никаких данных, обратитесь за помощью в службу поддержки клиентов.

Более подробные инструкции по устранению неполадок см. в статье Руководство по устранению неполадок агента Azure Monitor.

Визуализации аналитики

После включения Insights в следующих таблицах содержатся сведения обо всех ресурсах.

Здравоохранение

Предоставляет сбои работоспособности в кластере.

Metric Описание Единица измерения Пример
Сбой Краткое описание сбоев работоспособности. При щелчке по ссылке откроется боковая панель с дополнительными сведениями. Без единицы PoolCapacityThresholdExceededed
Тип ресурса сбоя Тип ресурса, который столкнулся с ошибкой. Без единицы StoragePool
Идентификатор неисправного ресурса Уникальный идентификатор ресурса, который столкнулся с ошибкой работоспособности. Уникальный идентификатор {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Статус Серьезность сбоя может быть предупреждающим или критическим. Без единицы Предупреждение
Начальное время сбоя Метка времени последнего обновления сервера. Datetime 09.04.2022, 12:15:42

Сервер

Metric Описание Единица измерения Пример
Серверы Имена серверов в кластере. Без единицы VM-1
Последнее обновление Дата и время последнего обновления сервера. Datetime 09.04.2022, 12:15:42
Состояние Работоспособность ресурсов сервера в кластере. Это могут быть работоспособные, предупреждающие, критические и другие Работоспособно
Загрузка ЦП Процент времени, в течение которого процесс использовал ЦП. Процент 56 %
Использование памяти Использование памяти серверным процессом равно счетчику Process\Private Bytes плюс размер сопоставленных в памяти данных. Процент 16 %
Логические процессоры. Количество логических процессоров. Счетчик 2
ЦП Число ЦП. Счетчик 2
Время доступности Время, в течение которого компьютер, особенно компьютер, находится в эксплуатации. Временной диапазон 2.609 ч.
Сайт Имя сайта, к которому принадлежит сервер. Имя сайта SiteA
Доменное имя Локальный домен, к которому принадлежит сервер. Без единицы Contoso.local

Виртуальные машины

Предоставляет состояние всех виртуальных машин в кластере. Виртуальная машина может находиться в одном из следующих состояний: Выполняется, Остановлено, Сбой или Другое (Неизвестно, Запуск, Моментальный снимок, Сохранение, Остановка, Приостановка, Возобновление, Приостановлено, Приостановлено).

Metric Описание Единица измерения Пример
Серверы Имя сервера. Без единицы Пример виртуальной машины 1
Последнее обновление Это дает дату и время последнего обновления сервера. Datetime 09.04.2022, 12:24:02
Общее число виртуальных машин Количество виртуальных машин в узле сервера. Count 0 из 0 выполняется
Запущен Количество виртуальных машин, работающих в узле сервера. Счетчик 2
Остановлена Количество виртуальных машин, остановленных на серверном узле. Счетчик 3
Сбой Количество виртуальных машин, завершилось сбоем на серверном узле. Счетчик 2
Другое Если виртуальная машина находится в одном из следующих состояний ("Неизвестно", "Запуск", "Моментальный снимок", "Сохранение", "Остановка", "Приостановка", "Приостановлено", "Приостановлено"), она считается "Другим". Счетчик 2

Память

В следующей таблице приведены сведения о работоспособности томов и дисков в кластере.

Metric Описание Единица измерения Пример
Тома Имя тома Без единицы ClusterPerformanceHistory
Последнее обновление Дата и время последнего обновления хранилища. Datetime 14.04.2022 г., 14:58:55
Состояние Состояние тома. Работоспособно, предупреждение, критическое и другое. Работоспособно
Общая емкость Общая емкость устройства в байтах за отчетный период. Байты 2,5 ГБ
Доступная емкость Доступная емкость в байтах в отчетный период. Байты 20B
Iops Количество операций ввода-вывода в секунду. посекундно. 45 в секунду
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений Байты в секунду 5B/с
Задержка Время, необходимое для выполнения запроса ввода-вывода. Второе 0,0016 с
Устойчивость Емкость для восстановления после сбоев. Обеспечивает максимальную доступность данных. Без единицы Трехсторонное зеркало
Дедупликация Процесс уменьшения физического числа байтов данных, которые должны храниться на диске. Доступно или нет Да/нет
Файловая система Тип файловой системы. Без единицы ReFS

Цены на Azure Monitor

При включении визуализации мониторинга журналы собираются из:

  • Управление работоспособностью (Microsoft-windows-health/operational).
  • Управление SDDC (Microsoft-Windows-SDDC-Management/Operational; Идентификатор события: 3000, 3001, 3002, 3003, 3004).

Счета выставляются на основе объема принятых данных и параметров хранения данных в рабочей области Log Analytics.

В Azure Monitor есть цены с оплатой по мере использования, а первые 5 ГБ на учетную запись выставления счетов в месяц предоставляются бесплатно. Так как цены могут отличаться из-за нескольких факторов, таких как регион Azure, который вы используете, ознакомьтесь с калькулятором цен Azure Monitor для получения наиболее актуальных расчетов цен.

Дальнейшие действия