Поделиться через


Мониторинг нескольких кластеров Azure Stack HCI версии 23H2 с помощью Insights

Область применения: Azure Stack HCI версии 23H2

В этой статье объясняется, как использовать Аналитику для мониторинга нескольких кластеров Azure Stack HCI. Сведения о одном кластере Azure Stack HCI см. в статье "Мониторинг Azure Stack HCI" с помощью Insights.

Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждого кластера см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".

Чтобы отслеживать несколько кластеров с помощью Insights, необходимо включить Аналитику для каждого кластера по отдельности. Вместо этого вы можете включить аналитику в масштабе с помощью политик Azure. Дополнительные сведения см. в статье "Включение Аналитики для Azure Stack HCI" в масштабе с помощью политик Azure.

Просмотрите видео с кратким введением:

Просмотр сведений о работоспособности, производительности и использовании

Аналитика хранит свои данные в рабочей области Log Analytics, что позволяет обеспечить эффективную агрегирование и фильтрацию и анализ тенденций данных с течением времени. Для Аналитики нет прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Вы можете получить доступ к Аналитике из Azure Monitor>Insights>Azure Stack HCI. Используйте следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, серверов, виртуальных машин и хранилища.

Фильтрация результатов

Визуализация может быть отфильтровано по подпискам. Результаты можно отфильтровать на основе следующих раскрывающихся меню:

  • Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
  • Подписки. Показывает подписки, которые зарегистрировали кластеры Azure Stack HCI. В этом фильтре можно выбрать несколько подписок.
  • Кластеры HCI: перечисляет зарегистрированные кластеры Azure Stack HCI, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
  • Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.

Добавление в мониторинг

Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите "Аналитика возможностей>". Если кластер не отображается, убедитесь, что он недавно подключен к Azure.

Снимок экрана: выбор кластера для мониторинга.

Столбец Description Пример
Кластер Имя кластера. 27cls1
Состояние подключения Azure Состояние ресурса HCI. Connected
Версия ОС Операционная система строится на сервере. 10.0.20348.10131

По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:

Снимок экрана: экран для задания значений сетки.

Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:

Снимок экрана: ссылка для экспорта в Excel.

Excel предоставит следующее состояние подключения Azure:

  • 0. Не зарегистрировано
  • 1. Отключено
  • 2. Не недавно
  • 3. Подключено

Работоспособность кластера

Это представление содержит обзор работоспособности кластеров.

Снимок экрана: общие сведения о работоспособности кластера.

Столбец Description Пример
Кластер Имя кластера. 27cls1
Последнее обновление Метка времени последнего обновления сервера. 4.9.2022, 12:15:42
Состояние Обеспечивает работоспособность ресурсов сервера в кластере. Это может быть здорово, предупреждение, критическое или другое. Работоспособно
Ресурс сбоя Описание того, какой ресурс вызвал ошибку. Сервер, StoragePool, подсистема
Всего серверов Количество серверов в кластере. 4

Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Кроме того, убедитесь, что кластеры недавно подключены к Azure и убедитесь, что кластеры не отфильтрованы в этой книге.

Сервер

Это представление содержит общие сведения о работоспособности сервера и производительности и использовании выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с ресурсом кластера и сервера, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: работоспособность серверов.

Виртуальные машины

Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена для просмотра распределения виртуальных машин между серверами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: работоспособность виртуальных машин.

Метрическая Description Пример
Сервер кластера > Имя кластера. При расширении отображаются серверы в кластере. Sample-VM-1
Последнее обновление Метка даты и времени последнего обновления сервера. 4.9.2022, 12:24:02
Общее число виртуальных машин Количество виртуальных машин в узле сервера в кластере. 1 из 2 запущенных
Выполняется Количество виртуальных машин, работающих на узле сервера в кластере. 2
Остановлено Количество виртуальных машин, остановленных на узле сервера в кластере. 3
Неудачно Количество виртуальных машин в узле сервера в кластере завершилось сбоем. 2
Другие Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка), она считается другой. 2

Хранилище

В этом представлении показана работоспособность томов, использования и производительности в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Плитки в верхней части содержат обзор работоспособности хранилища.

Снимок экрана: работоспособность томов хранилища.

Метрическая Description Пример
Том кластера > Имя кластера. При расширении отображаются тома в кластере. AltaylCluster1 > ClusterPerformanceHistory
Последнее обновление Метка даты и времени последнего обновления хранилища. 4.14.2022, 2:58:55
Работоспособности тома Состояние тома. Это может быть здорово, предупреждение, критическое или другое. Работоспособно
Размер Общая емкость устройства в байтах за отчетный период. 25 млрд
Использование Процент доступной емкости в течение отчетного периода. 23.54%
Iops Количество операций ввода-вывода в секунду. 45/с
Тренд Тенденция операций ввода-вывода в секунду.
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений 5B/с
Тренд (B/s) Тенденция пропускной способности.
Среднее время задержки Задержка — это среднее время, необходимое для завершения запроса ввода-вывода. 334 мкс

Настройка аналитики

Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.

Если вы используете визуализацию из Центра > Azure Monitor > Insights Azure Stack HCI, выберите "Изменить > > сохранить как", чтобы сохранить копию измененной версии в пользовательской книге.

Книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой книге.

Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:

Поддержка

Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для Azure Stack HCI в разделе "Мониторинг и управление".

Канал журнала событий

Аналитические представления и представления мониторинга основаны на канале журнала событий Windows-SDDC-Management или Operations Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.

Просмотр и изменение интервала кэша дампа

Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).

Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Используйте следующие командлеты, чтобы изменить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

События Windows в канале журнала

Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.

Идентификатор события Тип события
3000 Сервер
3001 Диск
3002 Громкость
3003 Виртуальная машина
3004 Кластер

Значение столбца RenderedDescription на сервере 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются самообязательными из этих сведений JSON. Однако в следующей таблице перечислены несколько переменных, которые немного сложнее понять.

«Переменная» Description
m_servers Массив узлов сервера.
m_statusCategory Состояние работоспособности сервера.
m_status Состояние сервера. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Работоспособно
1 Предупреждение
2 Unhealthy
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Up
1 Down
2 В обслуживании
3 Присоединение
4 Обычная
5 Изоляция
6 Помещено в карантин
7 Осушение
8 Очистка завершена
9 Сбой очистки
0xffff Неизвестно

Значение столбца RenderedDescription события диска 3001

Событие диска 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Значение столбца RenderedDescription события тома 3002

Событие тома 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются самообязательными из приведенных выше сведений JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

«Переменная» Description
VolumeList Массив томов.
m_StatusCategory Состояние работоспособности тома.
m_Status Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Работоспособно
1 Предупреждение
2 Unhealthy
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Неизвестно
1 Другие
2 ОК
3 Требуется восстановление
4 Ударный
5 Прогнозируемый сбой
6 Ошибка
7 Неустранимая ошибка
8 Запуск
9 Остановка
10 Остановлено
11 Обслуживается
12 Нет контакта
13 Связь потеряна
14 Прервано
15 Бездействует
16 Поддержка сущности в ошибке
17 Завершено
18 Режим питания
19 Перемещение
0xD002 Down
0xD003 Требуется повторная синхронизация

Значение столбца RenderedDescription события виртуальной машины 3003

Событие виртуальной машины 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Значение столбца RenderedDescription для события кластера 3004

Событие кластера 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Дополнительные сведения о собранных данных см. в служба работоспособности сбоях.

Следующие шаги

Связанные сведения: