Мониторинг нескольких кластеров Azure Stack HCI версии 23H2 с помощью Insights
Область применения: Azure Stack HCI версии 23H2
В этой статье объясняется, как использовать Аналитику для мониторинга нескольких кластеров Azure Stack HCI. Сведения о одном кластере Azure Stack HCI см. в статье "Мониторинг Azure Stack HCI" с помощью Insights.
Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждого кластера см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".
Чтобы отслеживать несколько кластеров с помощью Insights, необходимо включить Аналитику для каждого кластера по отдельности. Вместо этого вы можете включить аналитику в масштабе с помощью политик Azure. Дополнительные сведения см. в статье "Включение Аналитики для Azure Stack HCI" в масштабе с помощью политик Azure.
Просмотрите видео с кратким введением:
Просмотр сведений о работоспособности, производительности и использовании
Аналитика хранит свои данные в рабочей области Log Analytics, что позволяет обеспечить эффективную агрегирование и фильтрацию и анализ тенденций данных с течением времени. Для Аналитики нет прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.
Вы можете получить доступ к Аналитике из Azure Monitor>Insights>Azure Stack HCI. Используйте следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, серверов, виртуальных машин и хранилища.
Фильтрация результатов
Визуализация может быть отфильтровано по подпискам. Результаты можно отфильтровать на основе следующих раскрывающихся меню:
- Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
- Подписки. Показывает подписки, которые зарегистрировали кластеры Azure Stack HCI. В этом фильтре можно выбрать несколько подписок.
- Кластеры HCI: перечисляет зарегистрированные кластеры Azure Stack HCI, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
- Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.
Добавление в мониторинг
Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите "Аналитика возможностей>". Если кластер не отображается, убедитесь, что он недавно подключен к Azure.
Столбец | Description | Пример |
---|---|---|
Кластер | Имя кластера. | 27cls1 |
Состояние подключения Azure | Состояние ресурса HCI. | Connected |
Версия ОС | Операционная система строится на сервере. | 10.0.20348.10131 |
По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:
Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:
Excel предоставит следующее состояние подключения Azure:
- 0. Не зарегистрировано
- 1. Отключено
- 2. Не недавно
- 3. Подключено
Работоспособность кластера
Это представление содержит обзор работоспособности кластеров.
Столбец | Description | Пример |
---|---|---|
Кластер | Имя кластера. | 27cls1 |
Последнее обновление | Метка времени последнего обновления сервера. | 4.9.2022, 12:15:42 |
Состояние | Обеспечивает работоспособность ресурсов сервера в кластере. Это может быть здорово, предупреждение, критическое или другое. | Работоспособно |
Ресурс сбоя | Описание того, какой ресурс вызвал ошибку. | Сервер, StoragePool, подсистема |
Всего серверов | Количество серверов в кластере. | 4 |
Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Кроме того, убедитесь, что кластеры недавно подключены к Azure и убедитесь, что кластеры не отфильтрованы в этой книге.
Сервер
Это представление содержит общие сведения о работоспособности сервера и производительности и использовании выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с ресурсом кластера и сервера, чтобы перейти на соответствующую страницу ресурсов.
Виртуальные машины
Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена для просмотра распределения виртуальных машин между серверами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.
Метрическая | Description | Пример |
---|---|---|
Сервер кластера > | Имя кластера. При расширении отображаются серверы в кластере. | Sample-VM-1 |
Последнее обновление | Метка даты и времени последнего обновления сервера. | 4.9.2022, 12:24:02 |
Общее число виртуальных машин | Количество виртуальных машин в узле сервера в кластере. | 1 из 2 запущенных |
Выполняется | Количество виртуальных машин, работающих на узле сервера в кластере. | 2 |
Остановлено | Количество виртуальных машин, остановленных на узле сервера в кластере. | 3 |
Неудачно | Количество виртуальных машин в узле сервера в кластере завершилось сбоем. | 2 |
Другие | Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка), она считается другой. | 2 |
Хранилище
В этом представлении показана работоспособность томов, использования и производительности в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Плитки в верхней части содержат обзор работоспособности хранилища.
Метрическая | Description | Пример |
---|---|---|
Том кластера > | Имя кластера. При расширении отображаются тома в кластере. | AltaylCluster1 > ClusterPerformanceHistory |
Последнее обновление | Метка даты и времени последнего обновления хранилища. | 4.14.2022, 2:58:55 |
Работоспособности тома | Состояние тома. Это может быть здорово, предупреждение, критическое или другое. | Работоспособно |
Размер | Общая емкость устройства в байтах за отчетный период. | 25 млрд |
Использование | Процент доступной емкости в течение отчетного периода. | 23.54% |
Iops | Количество операций ввода-вывода в секунду. | 45/с |
Тренд | Тенденция операций ввода-вывода в секунду. | |
Пропускная способность | Количество байтов в секунду, обрабатываемых Шлюзом приложений | 5B/с |
Тренд (B/s) | Тенденция пропускной способности. | |
Среднее время задержки | Задержка — это среднее время, необходимое для завершения запроса ввода-вывода. | 334 мкс |
Настройка аналитики
Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.
Если вы используете визуализацию из Центра > Azure Monitor > Insights Azure Stack HCI, выберите "Изменить > > сохранить как", чтобы сохранить копию измененной версии в пользовательской книге.
Книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой книге.
Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:
- Изучение и предоставление общего доступа к данным об использовании c интерактивными книгами в Application Insights
- Начало работы с Kusto
- Примеры запросов начального графа ресурсов
Поддержка
Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для Azure Stack HCI в разделе "Мониторинг и управление".
Канал журнала событий
Аналитические представления и представления мониторинга основаны на канале журнала событий Windows-SDDC-Management или Operations Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.
Просмотр и изменение интервала кэша дампа
Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).
Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:
Get-ClusterResource "sddc management" | Get-ClusterParameter
Используйте следующие командлеты, чтобы изменить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:
Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>
События Windows в канале журнала
Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.
Идентификатор события | Тип события |
---|---|
3000 | Сервер |
3001 | Диск |
3002 | Громкость |
3003 | Виртуальная машина |
3004 | Кластер |
Значение столбца RenderedDescription на сервере 3000
{
"m_servers":[
{
"m_statusCategory":"Integer",
"m_status":[
"Integer",
"…"
],
"m_id":"String",
"m_name":"String",
"m_totalPhysicalMemoryInBytes":"Integer",
"m_usedPhysicalMemoryInBytes":"Integer",
"m_totalProcessorsUsedPercentage":"Integer",
"m_totalClockSpeedInMHz":"Integer",
"m_uptimeInSeconds":"Integer",
"m_InboundNetworkUsage":"Double (Bits/sec)",
"m_OutboundNetworkUsage":"Double (Bits/sec)",
"m_InboundRdmaUsage":"Double (Bits/sec)",
"m_OutboundRdmaUsage":"Double (Bits/sec)",
"m_site":"String",
"m_location":"String",
"m_vm":{
"m_totalVmsUnknown":"Integer",
"m_totalVmsRunning":"Integer",
"m_totalVmsStopped":"Integer",
"m_totalVmsFailed":"Integer",
"m_totalVmsPaused":"Integer",
"m_totalVmsSuspended":"Integer",
"m_totalVmsStarting":"Integer",
"m_totalVmsSnapshotting":"Integer",
"m_totalVmsSaving":"Integer",
"m_totalVmsStopping":"Integer",
"m_totalVmsPausing":"Integer",
"m_totalVmsResuming":"Integer"
},
"m_osVersion":"String",
"m_buildNumber":"String",
"m_totalPhysicalProcessors":"Integer",
"m_totalLogicalProcessors":"Integer"
},
"…"
],
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Большинство переменных являются самообязательными из этих сведений JSON. Однако в следующей таблице перечислены несколько переменных, которые немного сложнее понять.
«Переменная» | Description |
---|---|
m_servers | Массив узлов сервера. |
m_statusCategory | Состояние работоспособности сервера. |
m_status | Состояние сервера. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9). |
Значения переменной m_statusCategory приведены следующим образом:
Значение | Значение |
---|---|
0 | Работоспособно |
1 | Предупреждение |
2 | Unhealthy |
255 | Другие |
Значения для переменной m_status приведены следующим образом:
Значение | Значение |
---|---|
0 | Up |
1 | Down |
2 | В обслуживании |
3 | Присоединение |
4 | Обычная |
5 | Изоляция |
6 | Помещено в карантин |
7 | Осушение |
8 | Очистка завершена |
9 | Сбой очистки |
0xffff | Неизвестно |
Значение столбца RenderedDescription события диска 3001
Событие диска 3001
{
"m_drives":[
{
"m_uniqueId":"String",
"m_model":"String",
"m_type":"Integer",
"m_canPool":"Boolean",
"m_sizeInBytes":"Integer",
"m_sizeUsedInBytes":"Integer",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
},
"…"
],
"m_correlationId":"String",
"m_isLastElement":"Boolean"
}
Значение столбца RenderedDescription события тома 3002
Событие тома 3002
{
"VolumeList":[
{
"m_Id":"String",
"m_Label":"String",
"m_Path":"String",
"m_StatusCategory":"Integer",
"m_Status":[
"Integer",
"…"
],
"m_Size":"Integer (Bytes)",
"m_SizeUsed":"Integer (Bytes)",
"m_TotalIops":"Double (Count/second)",
"m_TotalThroughput":"Double (Bytes/Second)",
"m_AverageLatency":"Double (Seconds)",
"m_Resiliency":"Integer",
"m_IsDedupEnabled":"Boolean",
"m_FileSystem":"String"
},
"…"
],
"m_Alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Большинство переменных являются самообязательными из приведенных выше сведений JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.
«Переменная» | Description |
---|---|
VolumeList | Массив томов. |
m_StatusCategory | Состояние работоспособности тома. |
m_Status | Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9). |
Значения переменной m_statusCategory приведены следующим образом:
Значение | Значение |
---|---|
0 | Работоспособно |
1 | Предупреждение |
2 | Unhealthy |
255 | Другие |
Значения для переменной m_status приведены следующим образом:
Значение | Значение |
---|---|
0 | Неизвестно |
1 | Другие |
2 | ОК |
3 | Требуется восстановление |
4 | Ударный |
5 | Прогнозируемый сбой |
6 | Ошибка |
7 | Неустранимая ошибка |
8 | Запуск |
9 | Остановка |
10 | Остановлено |
11 | Обслуживается |
12 | Нет контакта |
13 | Связь потеряна |
14 | Прервано |
15 | Бездействует |
16 | Поддержка сущности в ошибке |
17 | Завершено |
18 | Режим питания |
19 | Перемещение |
0xD002 | Down |
0xD003 | Требуется повторная синхронизация |
Значение столбца RenderedDescription события виртуальной машины 3003
Событие виртуальной машины 3003
{
"m_totalVmsUnknown":"Integer",
"m_totalVmsRunning":"Integer",
"m_totalVmsStopped":"Integer",
"m_totalVmsFailed":"Integer",
"m_totalVmsPaused":"Integer",
"m_totalVmsSuspended":"Integer",
"m_totalVmsStarting":"Integer",
"m_totalVmsSnapshotting":"Integer",
"m_totalVmsSaving":"Integer",
"m_totalVmsStopping":"Integer",
"m_totalVmsPausing":"Integer",
"m_totalVmsResuming":"Integer",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Значение столбца RenderedDescription для события кластера 3004
Событие кластера 3004
{
"m_cpuUsage":"Double (%)",
"m_totalVolumeIops":"Double",
"m_averageVolumeLatency":"Double (Seconds)",
"m_totalVolumeThroughput":"Double (Bytes/Second)",
"m_totalVolumeSizeInBytes":"Integer",
"m_usedVolumeSizeInBytes":"Integer",
"m_totalMemoryInBytes":"Integer",
"m_usedMemoryInBytes":"Integer",
"m_isStretch":"Boolean",
"m_QuorumType":"String",
"m_QuorumMode":"String",
"m_QuorumState":"String",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
Дополнительные сведения о собранных данных см. в служба работоспособности сбоях.
Следующие шаги
Связанные сведения: