Поделиться через


Сведения о доступности виртуальных машин в Azure Resource Graph

Azure Resource Graph — это служба Azure, которая позволяет использовать тот же язык запросов KQL, который используется в запросах к журналам, чтобы запрашивать ресурсы Azure в большом масштабе с помощью сложной фильтрации, группирования и сортировки по свойствам ресурсов. Заметки о работоспособности виртуальных машин в Azure Resource Graph (ARG) можно использовать для подробного анализа атрибуции сбоев и простоев, включая следующие:

  • Запрашивайте последние snapshot доступности виртуальных машин во всех подписках Azure.
  • Оцените влияние на соглашения об уровне обслуживания для бизнеса и инициируете решительные действия по устранению рисков в ответ на перебои и тип сигнатуры сбоя.
  • Настройте пользовательские панели мониторинга для контроля полной работоспособности приложений, объединяя сведения о доступности виртуальных машин с дополнительными метаданными ресурсов в Resource Graph.
  • Отслеживайте соответствующие изменения в доступности виртуальных машин в течение последовательного 14-дневного периода с помощью механизма отслеживания изменений для проведения подробных исследований.

Чтобы начать работу с Resource Graph, откройте Resource Graph Обозреватель в портал Azure. Перейдите на вкладку Таблица и просмотрите таблицы microsoft.resourcehealth/availabilitystatuses и microsoft.resourcehealth/resourceannotations, описанные ниже. Щелкните healthresources , чтобы создать простой запрос, а затем нажмите кнопку Выполнить , чтобы вернуть записи.

Снимок экрана: Resource Graph Azure с простым запросом healthresources.

Чтобы просмотреть сведения о записи, прокрутите вправо и выберите Просмотреть сведения.

Снимок экрана: подробная запись azure Resource Graph healthresources.

В таблице HealthResources будут заполнены два типа событий:

microsoft.resourcehealth/availabilitystatuses

Это событие обозначает последнее состояние доступности виртуальной машины на основе проверок работоспособности , выполняемых базовой платформой Azure. В настоящее время для виртуальных машин создаются следующие состояния доступности .

  • Доступно: виртуальная машина работает должным образом.
  • Недоступно: обнаружено нарушение нормальной работы виртуальной машины.
  • Неизвестно. Платформа не может точно определить работоспособность виртуальной машины. Вернитесь через несколько минут.

Состояние доступности находится в properties поле записи, которое включает следующие свойства:

Поле Описание
targetResourceType Тип ресурса, для которого передаются данные о работоспособности
targetResourceId Идентификатор ресурса
произошлоTime Метка времени, когда платформа генерирует последнее состояние доступности
previousAvailabilityState Предыдущее состояние доступности виртуальной машины
availabilityState Текущее состояние доступности виртуальной машины

Пример properties значения выглядит следующим образом:

{
    "targetResourceType": "Microsoft.Compute/virtualMachines",
    "targetResourceId": "/subscriptions/<subscriptionId>/resourceGroups/<ResourceGroupName>/providers/Microsoft.Compute/virtualMachines/<VMName>",
    "occurredTime": "2022-10-11T11:13:59.9570000Z",
    "previousAvailabilityState": "Available",
    "availabilityState": "Unavailable"
}

microsoft.resourcehealth/resourceannotations

Это событие контекстуализирует любые изменения доступности виртуальной машины, детализируя необходимые атрибуты сбоя, которые помогут вам исследовать и устранять неполадки при необходимости. Полный список заметок о работоспособности виртуальных машин приведен в [Работоспособность ресурсов заметки о работоспособности виртуальной машины] (.. /service-health/resource-health-vm-annotation.md).

Эти заметки можно широко классифицировать по следующим:

  • Заметки о времени простоя: создаются, когда платформа обнаруживает, что доступность виртуальной машины переходит на Недоступно. Примеры включают сбои узла или операции перезагрузки.
  • Информационные заметки: создаются во время действий уровня управления, не влияющих на доступность виртуальных машин. Примеры: выделение виртуальных машин, остановка, удаление, запуск. Как правило, никаких дополнительных действий клиента в ответ не требуется.
  • Заметки с пониженной производительности: создаются при обнаружении риска для доступности виртуальной машины. Например, модели прогнозирования сбоев предсказывают снижение производительности аппаратного компонента, что может привести к перезагрузке виртуальной машины в любой момент времени. Необходимо повторно выполнить развертывание до крайнего срока, указанного в сообщении заметки, чтобы избежать непредубежной потери данных или простоя.
Поле Описание
targetResourceType Тип ресурса, для которого передаются данные о работоспособности
targetResourceId Идентификатор ресурса
произошлоTime Метка времени, когда платформа генерирует последнее состояние доступности
annotationName Имя создаваемой заметки
reason Краткий обзор влияния на доступность, наблюдаемого клиентом
категория Указывает, было ли действие платформы, активировающее заметку, плановым обслуживанием или незапланированным ремонтом. Это поле неприменимо к событиям, инициированным клиентом или виртуальной машиной.

Возможные значения: Запланированные | Незапланированные | Неприменимо | Null
контекст Указывает, было ли действие, активировающее заметку, вызвано авторизованным пользователем или процессом (инициированным клиентом), платформой Azure (инициированной платформой) или действием в гостевой ОС, что привело к снижению доступности (инициировано виртуальной машиной).

Возможные значения: Platform-Initiated | Инициированные пользователем | Инициировано виртуальной машиной | Неприменимо | Null
Итоги Заявление с подробными сведениями о причине выбросов заметок, а также действия по исправлению, которые могут быть выполнены пользователями

Примеры запросов с использованием этих данных см. в статье Azure Resource Graph примеры запросов по таблице.

Дальнейшие действия