Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Если вы не уверены в лучших значениях, используемых в качестве пороговых значений для правил генерации оповещений, динамические пороговые значения применяют расширенное машинное обучение и используют набор алгоритмов и методов для:
- Узнайте о историческом поведении метрик и результатах запросов по журналам.
- Анализ данных с течением времени и определение шаблонов, таких как почасовые, ежедневные или еженедельные шаблоны.
- Распознать аномалии, указывающие на возможные проблемы.
- Вычислите наиболее подходящие пороговые значения.
При использовании динамических пороговых значений вам не нужно знать правильное пороговое значение для каждой метрики. Динамические пороговые значения вычисляют наиболее подходящие пороговые значения.
Динамические пороги помогут вам делать следующее:
- Создавать масштабируемые оповещения для сотен серий метрик с одним правилом генерации оповещений. Если у вас меньше правил генерации оповещений, вы тратите меньше времени на создание и управление ими. Масштабируемые оповещения особенно полезны для нескольких измерений или для нескольких ресурсов, таких как все ресурсы в подписке.
- Создавайте правила без необходимости знать, какое пороговое значение необходимо настроить.
- Настройте оповещения метрик с помощью высокоуровневых концепций, не нуждаясь в обширных знаниях о области метрик.
- Предотвращение шумных (низких точности) или пороговых значений (низкой точности), которые не имеют ожидаемого шаблона.
Вы можете использовать динамические пороговые значения для:
- Большинство платформ Azure Monitor и пользовательские метрики.
- Общие метрики приложений и инфраструктуры.
- Шумные метрики, такие как метрики ЦПУ или памяти виртуальной машины, или метрики с низким разбросом, например, доступность и частота ошибок.
- Результаты запроса логов (предварительный просмотр).
Динамические пороговые значения можно настроить с помощью:
- Портал Azure.
- Шаблоны оповещений метрик.
- Шаблоны PowerShell, CLI или Azure Resource Manager для правил оповещений о метриках.
- Шаблоны Azure Resource Manager для правил генерации оповещений поиска по журналам. PowerShell и CLI пока не поддерживаются.
Вычисление пороговых значений оповещений и предварительная версия
При создании правила генерации оповещений динамические пороговые значения используют 10 дней исторических данных для вычисления почасовых или ежедневных сезонных шаблонов. Диаграмма, которая отображается в предварительном просмотре оповещений, отражает эти данные.
Динамические пороговые значения постоянно используют все доступные исторические данные для изучения, и они делают корректировки более точными. Через три недели динамические пороговые значения имеют достаточно данных для определения еженедельных шаблонов, и модель корректируется, чтобы включить еженедельную сезонность.
Это гарантирует, что после завершения сбоя пороговые значения остаются согласованными с нормальным поведением, а не адаптацией к сбою в качестве нового нормального. Короткие пики или значения сдвига обрабатываются по-разному: динамические пороговые значения применяют сезонность и обнаружение тенденций, а также минимальное время нарушения, чтобы уменьшить ложные положительные значения от кратковременных аномалий.
Рекомендации по использованию динамических пороговых значений
- Чтобы обеспечить точное вычисление пороговых значений, правила генерации оповещений, использующие динамические пороговые значения, не активируют оповещение перед сбором трех дней и по крайней мере 30 выборок данных. Новые ресурсы или ресурсы, для которых отсутствуют данные, не активируют оповещение до тех пор, пока не будет доступно достаточно данных.
- Динамические пороговые значения требуют по крайней мере три недели исторических данных для обнаружения еженедельной сезонности. Некоторые подробные шаблоны, такие как двунаправленные или полунедельные шаблоны, могут быть не обнаружены.
- Изменения в поведении данных. Если поведение данных изменилось недавно, изменения не отражаются сразу же в верхних и нижних границах динамического порога. Эти границы рассчитываются на основе данных метрик за последние 10 дней.
- Динамические пороговые значения хорошо подходит для обнаружения значительных отклонений, а не для медленно развивающихся проблем. Медленные изменения поведения, вероятно, не будут активировать оповещение.
- Динамические пороговые значения нельзя использовать в правилах генерации оповещений, отслеживающих несколько условий.
- Динамические пороговые значения нельзя использовать в правилах генерации оповещений поиска журналов с частотой 1 минуты.
Создайте правило оповещений метрик с динамическими порогами
Чтобы настроить динамические пороговые значения, выполните процедуру создания правила генерации оповещений. Используйте эти параметры на вкладке "Условие ".
- Для параметра "Пороговое значение" выберите Dynamic.
- Для типа агрегирования рекомендуется не выбрать максимальное значение.
- Для оператор выберите больше, если поведение не представляет собой использование приложения.
- Для чувствительности порога выберите Средний или Низкий, чтобы уменьшить шум оповещений.
- Для проверки каждого выберите частоту проверки правила генерации оповещений, если условие выполнено. Чтобы свести к минимуму влияние оповещения на бизнес, рекомендуется использовать более низкую частоту. Убедитесь, что это значение меньше или равно значению периода ретроспективы.
- Для периода ретроспективы задайте период времени, рассматриваемый при каждой проверке данных. Убедитесь, что это значение больше или равно проверке каждого значения.
- Для дополнительных параметров выберите, сколько нарушений активирует оповещение в течение определенного периода времени. При необходимости задайте дату, с которой нужно начать обучение исторических данных метрик и вычислить динамические пороговые значения.
Примечание.
Правила генерации оповещений метрик, созданные на портале, создаются в той же группе ресурсов, что и целевой ресурс.
Динамическая пороговая диаграмма
На следующей диаграмме показана метрика, ее динамические пороговые ограничения и некоторые оповещения, которые запускались при превышении допустимых пороговых значений.
Используйте следующие сведения для интерпретации диаграммы:
- Синяя линия: метрика, измеряемая с течением времени.
- Синяя затеняемая область: допустимый диапазон для метрики. Если значения метрик остаются в пределах этого диапазона, оповещение не активируется.
- Синие точки: агрегированные значения метрик. Если выбрать часть диаграммы, а затем навести указатель мыши на синюю линию, под курсором появится синяя точка, чтобы указать отдельное агрегированное значение метрики.
- Всплывающее поле с синей точкой: измеренное значение метрики (синяя точка) и верхние и нижние значения допустимого диапазона.
- Красная точка с черным кругом: первое значение метрик за пределами допустимого диапазона. Это значение запускает оповещение о метрике и переводит ее в активное состояние.
- Красные точки: другие измеряемые значения за пределами допустимого диапазона. Они не активируют больше оповещений метрик, но оповещение остается в активном состоянии.
- Красная область: время, когда значение метрики находилось за пределами допустимого диапазона. Оповещение остается в активном состоянии до тех пор, пока последующие измеренные значения находятся вне допустимого диапазона, но новые оповещения не запускаются.
- Конец красной области: возврат допустимых значений. Когда синяя линия возвращается внутри допустимых значений, красная область останавливается, а измеренная строка значения становится синей. Состояние оповещения метрик, запущенного во время красной точки с черным кругом, устанавливается для разрешения.
Метрики, не поддерживаемые динамическими порогами
Динамические пороговые значения поддерживают большинство метрик, но следующие метрики не могут использовать динамические пороговые значения:
| Тип ресурса | Имя метрики |
|---|---|
| Microsoft.ClassicStorage/storageAccounts | Использованная ёмкость |
| Microsoft.ClassicStorage/storageAccounts/blobServices (хранилище Microsoft Classic, учетные записи, службы объектов хранения) | Вместимость BLOB |
| Microsoft.ClassicStorage/storageAccounts/blobServices (хранилище Microsoft Classic, учетные записи, службы объектов хранения) | BlobCount |
| Microsoft.ClassicStorage/storageAccounts/blobServices (хранилище Microsoft Classic, учетные записи, службы объектов хранения) | Ёмкость индекса |
| Microsoft.ClassicStorage/storageAccounts/fileServices | Ёмкость файла |
| Microsoft.ClassicStorage/storageAccounts/fileServices | КоличествоФайлов |
| Microsoft.ClassicStorage/storageAccounts/fileServices | КоличествоПоделенныхФайлов |
| Microsoft.ClassicStorage/storageAccounts/fileServices | КоличествоСнимковОбщейПапки |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotSize |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareQuota |
| Microsoft.Compute/disks | Общая скорость чтения с диска (байт/с) |
| Microsoft.Compute/disks | Всего операций чтения с диска/с |
| Microsoft.Compute/disks | Общая скорость записи на диск (байт/с) |
| Microsoft.Compute/disks | Всего операций записи на диск/с |
| Служба контейнеров Microsoft/управляемые кластеры | Количество узлов |
| Служба контейнеров Microsoft/управляемые кластеры | PodCount |
| Служба контейнеров Microsoft/управляемые кластеры | КоличествоВыполненныхЗадач |
| Служба контейнеров Microsoft/управляемые кластеры | КоличествоПерезапускаКонтейнеров |
| Служба контейнеров Microsoft/управляемые кластеры | Количество контейнеров, завершенных из-за нехватки памяти |
| Microsoft.Devices/IotHubs | ОбщееКоличествоУстройств |
| Microsoft.Devices/IotHubs | ЧислоПодключённыхУстройств |
| Microsoft.DocumentDB/databaseAccounts | CassandraConnectionClosures |
| Microsoft.EventHub/clusters | Размер |
| Microsoft.EventHub/namespaces | ЦП |
| Microsoft.EventHub/namespaces | Использование памяти |
| Microsoft.EventHub/namespaces | ReplicationLagCount |
| Microsoft.EventHub/namespaces | Размер |
| Microsoft.IoTCentral/IoTApps | количествоПодключенныхУстройств |
| Microsoft.IoTCentral/IoTApps | количество настроенных устройств |
| Microsoft.Kubernetes/connectedClusters | Количество узлов |
| Microsoft.Kubernetes/connectedClusters | PodCount |
| Microsoft.Kubernetes/connectedClusters | КоличествоВыполненныхЗадач |
| Microsoft.Kubernetes/connectedClusters | КоличествоПерезапускаКонтейнеров |
| Microsoft.Kubernetes/connectedClusters | Количество контейнеров, завершенных из-за нехватки памяти |
| Microsoft.MachineLearningServices/рабочие пространства/онлайн Эндпоинты | Запросы в минуту |
| Microsoft.УслугиМашинногоОбучения/рабочиепространства/онлайнКонечныеТочки/развертывания | Вместимость развертывания |
| Microsoft.Maps/учетные записи | CreatorUsage |
| Microsoft.Media/mediaservices/streamingEndpoints (потоковые конечные точки) | Исходящая пропускная способность |
| Microsoft.Network/шлюзы приложений | Пропускная способность |
| Microsoft.Network/azureFirewalls | Пропускная способность |
| Microsoft.Network/expressRouteGateways | ExpressRouteGatewayPacketsPerSecond (пакеты в секунду шлюза ExpressRoute) |
| Microsoft.Network/expressRouteGateways | ExpressRouteGatewayNumberOfVmInVnet |
| Microsoft.Network/expressRouteGateways | ЧастотаМаршрутовИзмененаШлюзомExpressRoute |
| Microsoft.Network/виртуальные сетевые шлюзы | ExpressRouteGatewayБитыВСекунду |
| Microsoft.Network/виртуальные сетевые шлюзы | ExpressRouteGatewayPacketsPerSecond (пакеты в секунду шлюза ExpressRoute) |
| Microsoft.Network/виртуальные сетевые шлюзы | ExpressRouteGatewayNumberOfVmInVnet |
| Microsoft.Network/виртуальные сетевые шлюзы | ЧастотаМаршрутовИзмененаШлюзомExpressRoute |
| Microsoft.ServiceBus/namespaces | Количество активных сообщений в очереди или разделе. (ActiveMessages) |
| Microsoft.ServiceBus/namespaces | Количество недоставленных сообщений в очереди или разделе (DeadletteredMessages) |
| Microsoft.ServiceBus/namespaces | Количество сообщений в очереди или разделе (сообщения) |
| Microsoft.ServiceBus/namespaces | Количество запланированных сообщений в очереди или теме (ScheduledMessages) |
| Microsoft.ServiceBus/namespaces | ЦП (namespaceCpuUsage) |
| Microsoft.ServiceBus/namespaces | Использование памяти (NamespaceMemoryUsage) |
| Microsoft.ServiceBus/namespaces | Размер |
| Microsoft.ServiceFabricMesh/applications | Выделенный процессор |
| Microsoft.ServiceFabricMesh/applications | ВыделеннаяПамять |
| Microsoft.ServiceFabricMesh/applications | ActualCpu |
| Microsoft.ServiceFabricMesh/applications | ActualMemory |
| Microsoft.ServiceFabricMesh/applications | Статус заявки |
| Microsoft.ServiceFabricMesh/applications | ServiceStatus |
| Microsoft.ServiceFabricMesh/applications | ServiceReplicaStatus |
| Microsoft.ServiceFabricMesh/applications | ContainerStatus (Статус контейнера) |
| Microsoft.ServiceFabricMesh/applications | КоличествоПерезапусков |
| Microsoft.Storage/storageAccounts (хранилища аккаунтов) | Использованная ёмкость |
| Microsoft.Storage/storageAccounts/blobServices | Вместимость BLOB |
| Microsoft.Storage/storageAccounts/blobServices | BlobCount |
| Microsoft.Storage/storageAccounts/blobServices | Предоставленный размер Blob |
| Microsoft.Storage/storageAccounts/blobServices | Ёмкость индекса |
| Microsoft.Storage/storageAccounts/файловыеСервисы | Ёмкость файла |
| Microsoft.Storage/storageAccounts/файловыеСервисы | КоличествоФайлов |
| Microsoft.Storage/storageAccounts/файловыеСервисы | КоличествоПоделенныхФайлов |
| Microsoft.Storage/storageAccounts/файловыеСервисы | КоличествоСнимковОбщейПапки |
| Microsoft.Storage/storageAccounts/файловыеСервисы | FileShareSnapshotSize |
| Microsoft.Storage/storageAccounts/файловыеСервисы | Квота на объем файлового хранилища |
| Microsoft.Storage/storageAccounts/файловыеСервисы | Файловое Хранилище с Установленными IOPS |
Создание правила генерации оповещений поиска по журналам с динамическим пороговым значением (предварительная версия)
Чтобы настроить динамические пороговые значения, выполните процедуру создания правила генерации оповещений. Используйте эти параметры на вкладке "Условие".
- Настройте ваш запрос, метрику и измерения так же, как при использовании статического порога.
- Для параметра "Пороговое значение" выберите Dynamic.
- Выберите предварительный просмотр диаграммы, чтобы увидеть исторические данные запросов и вычисляемое динамическое пороговое значение, помогающее визуализировать, как порог адаптируется к нормальным шаблонам и где потенциальные оповещения будут возникать.
- После внесения изменений на вкладку условий выберите "Обновить диаграмму", чтобы просмотреть обновленную предварительную версию.
Примечание.
1-минутная частота не поддерживается в правилах оповещений для поиска логов с динамическим порогом.
Диаграмма предварительного просмотра динамических пороговых значений
На следующей диаграмме показано значение результата запроса правила оповещения, его динамические пороговые ограничения, нарушения этих порогов и оповещения, которые срабатывали при выходе значения за допустимые пороги. В этом сценарии число нарушений, необходимых для срабатывания оповещения, равно 2.
- Синяя линия: значение результата запроса, измеренное во времени.
- Пурпурная затеняемая область: вычисляемый динамический пороговый диапазон. Допустимый диапазон значений для результата запроса. Если значения остаются в этом диапазоне, оповещение не активируется.
- Красные точки: они представляют нарушения — оценки, которые привели к достижению порога.
- Розовые гистограммы: представляют сработавшее оповещение поиска в журналах.
Примечание.
Чтобы обеспечить производительность диаграммы предварительной версии, мы применяем ограничение на количество возвращаемых точек данных и, следовательно, допустимый диапазон времени, отображаемый в зависимости от частоты правила генерации оповещений. 5-минутная частота поддерживает 6 часов. Частота 10–15 минут достаточна для поддержки работы в течение 6 и 12 часов. 30-минутная частота поддерживает 6 и 12 часов и 1 день. Частота в 1 час или более поддерживает интервалы в 6 и 12 часов, а также 1 и 2 дня.
Известные проблемы с динамической чувствительностью порогового значения
Если правило генерации оповещений, использующее динамические пороги, слишком шумно или вызывает слишком много, может потребоваться уменьшить ее чувствительность. Используйте один из следующих методов.
- Пороговая чувствительность: задайте чувствительность на низкий уровень, чтобы увеличить терпимость к отклонениям.
- Период ретроспективного анализа (для правил оповещений метрик) или гранулярность агрегирования (для правил оповещений поиска журналов) — увеличение периода данных делает правило менее подверженным временным отклонениям.
- Количество нарушений (в разделе "Дополнительные параметры"): Настройте правило оповещения так, чтобы оно срабатывало только в случае, если в течение определенного периода времени происходит несколько отклонений. Это сделает правило менее подверженным воздействию временных отклонений.
Возможно, вы обнаружите, что правило генерации оповещений, использующее динамические пороговые значения, не срабатывает или не является достаточно чувствительным, даже если правило настроено с высокой чувствительностью. Этот сценарий может произойти, когда распределение метрики или результата запроса является очень нерегулярным. Рассмотрим одно из следующих решений:
- Перейдите к мониторингу дополнительных метрик или запросов журналов, которые подходят для вашего сценария, если это применимо. Например, проверьте наличие изменений в частоте успешных выполнений, а не частоте сбоев.
- Попробуйте выбрать другое значение для детализации агрегирования (период).
- Проверьте, произошло ли резкое изменение в поведении данных за последние 10 дней, например сбой. Резкое изменение может повлиять на верхние и нижние пороговые значения, вычисляемые для данных, и сделать их более широкими. Подождите несколько дней, пока сбой больше не будет включен в вычисление порогового значения. При использовании правил оповещений метрик можно также изменить правило оповещения, чтобы использовать параметр Игнорировать данные до в разделе Дополнительные параметры.
- Если ваши данные имеют еженедельную сезонность, но не хватает исторических данных, вычисляемые пороговые значения могут привести к широким верхним и нижним границам. Например, при вычислении рабочие дни и выходные дни могут обрабатываться одинаково, что приводит к расширению границ, которые не всегда соответствуют данным. Эта проблема должна устраниться после того, как будет доступна достаточная история запросов метрик или логов. Затем Azure Monitor обнаруживает правильную сезонность и обновляет вычисляемые пороговые значения соответствующим образом.
Если данные демонстрируют большие колебания, динамические пороговые значения могут создавать широкую модель вокруг значений данных, что может привести к снижению или более высокой границе, чем ожидалось. Этот сценарий может произойти, когда:
- установлен низкий уровень чувствительности;
- Метрика или результат запроса демонстрирует неправильное поведение с высокой дисперсией, которая отображается как пики или спады в данных.
Попробуйте сделать модель менее чувствительной, выбрав меньшую чувствительность или выбрав большее значение периода ретроспективы.
В правилах настройки оповещений метрик можно также использовать Игнорировать данные до для исключения недавних нарушений из исторических данных, используемых для построения модели.
Связанный контент
Если у вас есть отзывы о динамических пороговых значениях, отправьте нам сообщение электронной почты.