Рекомендации по метрикам. Часто задаваемые вопросы

Основные понятия

Когда помощник по метрикам будет нерекомендуем?

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы помощника по метрикам. Служба помощника по метрикам отменяется 1 октября 2026 года.

Что такое многомерные данные временных рядов?

См. определение многомерной метрики в глоссарии.

Сколько данных необходимо помощнику по метрикам, чтобы начать обнаружение аномалий?

Как минимум одна точка данных может активировать обнаружение аномалий. Однако это не гарантирует высокой точности. Служба будет считать окном предыдущих точек данных, используя значение, указанное в качестве правила "Заполнение" во время создания веб-канала данных.

Перед отметкой времени, которую необходимо определить, рекомендуется использовать некоторые данные. В зависимости от степени детализации данных рекомендуемая сумма данных варьируется, как показано ниже.

Степень детализации Рекомендуемый объем данных для обнаружения
Менее 5 минут 4 дня данных
От 5 минут до 1 дня 28 дней данных
Более 1 дня, до 31 дня 4 года данных
Более 31 дня 48 лет данных

Какие данные обрабатывает Помощник по метрикам и как они хранятся?

  • Помощник по метрикам обрабатывает данные временных рядов, собираемые из источника данных клиента; исторические данные используются для выбора модели и определяют предполагаемую границу данных.
  • Данные временных рядов клиента и результаты вывода будут храниться в службе. Помощник по метрикам не хранит или не обрабатывает данные клиентов за пределами региона, в котором клиент развертывает экземпляр службы.

Почему помощник по метрикам не обнаруживает аномалии из исторических данных?

Помощник по метрикам обнаруживает потоковые данные в реальном времени. Существует ограничение на максимальную длину исторических данных, которые будет просматривать служба и выполнять обнаружение аномалий. Это означает, что результаты обнаружения аномалий будут иметь только точки данных после определенной самой ранней метки времени. Самая ранняя отметка времени зависит от степени детализации данных.

В зависимости от степени детализации данных, длины исторических данных, для которых будут получены результаты обнаружения аномалий, приведены ниже.

Степень детализации Максимальная длина исторических данных для обнаружения аномалий
Менее 5 минут Интегрированное время — 13 часов
От 5 минут до менее 1 часа Время перехода на 4 дня
От 1 часа до менее 1 дня Время адаптации — 14 дней
1 день Время адаптации — 28 дней
Более 1 дня, менее 31 дня Интегрированное время — 2 года
Более 31 дня Время адаптации — 24 года

Хранение данных и ограничения в Помощнике по метрикам

  1. Хранение данных. Помощник по метрикам хранит не более 10 000интервалов времени, отсчитываемых вперед от текущей метки времени, независимо от того, доступны ли данные. Данные, выходящие за пределы указанного окна, удаляются. Ниже представлена зависимость длительности хранения данных от числа дней для различных степеней детализации метрик.
Степень детализации (мин) Хранение (дней)
1 6,94
5 34,72
15 104,1
60 (ежечасно) 416.67
1440 (ежедневно) 10000,00
  1. Максимальное число временных рядов в одной метрике.

В одной метрике может быть несколько измерений, и каждое измерение может иметь несколько значений. Максимальное сочетание измерений для одной метрики не должно превышать 100 КБ.

  • Администраторы ресурсов Помощника по метрикам и владельцы веб-каналов данных получат уведомления при достижении 80 % от ограничения на странице сведений о веб-канале данных.
  • Если метрика превысила ограничение, веб-канал данных будет приостановлен, после чего он будет ожидать выполнения дальнейших действий клиентом. Рекомендуется разделить веб-канал данных на несколько веб-каналов данных с помощью фильтрации.
  1. Максимальное количество точек данных, хранящихся в одном экземпляре Помощника по метрикам

Помощник по метрикам учитывает общее число точек данных из всех веб-каналов данных, подключенных к экземпляру, начиная с первой метки времени приема. Максимальное количество точек данных, сохраняемых в одном экземпляре Помощника по метрикам, составляет 2 000 000 000.

  • При достижении 80 % от ограничения администраторы ресурсов Помощника по метрикам и все пользователи получат уведомления на странице со списком веб-каналов данных и странице добавления нового веб-канала данных.
  • Если общее количество точек данных превысило ограничение, то все веб-каналы данных будут приостановлены, а подключение новых веб-каналов также будет блокироваться. Рекомендуется удалить неиспользуемые веб-каналы данных или создать новый ресурс Помощника по метрикам в подписке.

Почему не удается войти в Помощник по метрикам? Сообщение об ошибке говорит: "Ресурс будет выведен из эксплуатации из-за неактивного в 90 дней"

Деактивация ресурса осуществляется в двух случаях.

  • Ресурс Помощника по метрикам создан, однако веб-канал данных не был подключен в течение 90 дней. Ресурс будет деактивирован через 90 дней из-за отсутствия активности.
  • Если созданы один или несколько веб-каналов данных, однако Помощник по метрикам не принимает новые данные, служба перейдет в режим простоя без данных, которые требуется обработать. Система по-прежнему будет пытаться регулярно получать данные из источника в зависимости от степени детализации метрик. Однако если в течение 90 дней подряд данные по-прежнему будут недоступны или не появится отдельных временных рядов, которые требуется обработать, ресурс будет деактивирован. Все данные за прошедший период, связанные с ресурсом, при деактивации будут утеряны.

Если вы хотите перезапустить потребление, рекомендуется создать новый ресурс и удалить старый.

Как удалить обнаруженные пики и спады как аномалии?

Если имеются предварительно определенные жесткие пороговые значения, можно вручную задать "жесткое пороговое значение" в конфигурациях обнаружения аномалий. Если пороговые значения отсутствуют, можно использовать интеллектуальное обнаружение, которое включено в AI. Дополнительные сведения см. в разделе Настройка обнаружения конфигурации.

Как сделать так, чтобы несоответствие регулярным (сезонным) шаблонам выявлялось как аномалия?

Функция "Интеллектуальное обнаружение" учится выявлять в ваших данных закономерности, в том числе сезонные шаблоны, а затем сообщает о точках данных, не соответствующих этим шаблонам, как об аномалиях. Дополнительные сведения см. в разделе Настройка обнаружения конфигурации.

Поддерживает ли Помощник по метрикам источники данных за пределами виртуальной сети?

Нет, в настоящее время Помощник по метрикам не поддерживает источники данных за пределами виртуальной сети.

Как сделать так, чтобы ровные линии выявлялись как аномалия?

Если для ваших данных характерны значительные колебания и требуется узнавать, когда они слишком стабильны или вообще становятся ровной линией, можно настроить параметр "Порог изменения" так, чтобы обнаруживать точки данных, изменения между которыми слишком малы. См. дополнительные сведения о конфигурации обнаружения аномалий.

Как настроить параметры электронной почты и включить предупреждения по электронной почте?

  1. Пользователь с правами администратора подписки или администратора группы ресурсов должен перейти к ресурсу помощника по метрикам, созданному на портале Azure, и выбрать вкладку Управление доступом (IAM).

  2. ВыберитеДобавить назначение ролей

  3. Выберите роль Администратор помощника по метрикам Cognitive Services и щелкните свою учетную запись, как показано на рисунке ниже.

  4. Нажмите кнопку Сохранить, после чего вы будете добавлены в качестве администратора ресурса Помощника по метрикам. Все приведенные выше действия должны выполняться администратором подписки или группы ресурсов.

    Access control(IAM) menu page with add a role assignment selected, followed by a box with assign access to selected user displayed with an access role of Cognitive Services Metrics Advisor Administrator, followed by the save button of the UI being selected to illustrate the steps of searching for a user and adding a particular level of access permissions.

  5. Распространение разрешений может занять до одной минуты. Затем выберите рабочую область помощника по метрикам и параметр Электронная почта в левой навигационной панели. Заполните необходимые элементы, в частности сведения, относящиеся к SMTP.

  6. Выберите Сохранить, после чего все будет установлено в конфигурации электронной почты. Вы можете создавать новые обработчики и подписываться на аномалии, чтобы получить оповещения практически в реальном времени.

Дополнительные сведения

Как Помощник по метрикам создает дерево диагностики для многомерных метрик?

Метрику можно разделить на несколько временных рядов по измерениям. Например, метрика Response latency отслеживается для всех служб, принадлежащих команде. ServiceКатегорию можно использовать в качестве измерения для дополнения метрики, поэтому мы получаем Response latency разбиение по Service1, Service2 и т. д. Каждая служба может быть развернута на разных компьютерах в нескольких центрах обработки данных, поэтому эту метрику можно разделить по Machine и Data center.

Служба Центр обработки данных Компьютер
S1 DC1 M1
S1 DC1 M2
S1 DC2 M3
S1 DC2 M4
S2 DC1 M1
S2 DC1 M2
S2 DC2 M5
S2 DC2 M6
...

Начиная с итога Response latency, можно детализировать метрику на Service, Data center и Machine. Однако, возможно, для владельцев служб лучше использовать путь Service —>Data center —>Machine или, возможно, у инженеров инфраструктуры будет больше смысла использовать этот путь: Data Center —>Machine —>Service. Все зависит от индивидуальных бизнес-требований пользователей.

В помощнике по метрике пользователи могут указать любой путь для детализации или свертки с одного узла иерархической топологии. Точнее, иерархическая топология — это направленный ациклический граф, а не древовидная структура. Существует полная иерархическая топология, состоящая из всех возможных комбинаций измерений, например:

hierarchical topology diagram consisting of multiple interconnecting vertices and edges with multiple dimensions labeled S,DC, and M with corresponding numbers ranging from 1 to 6

Теоретически, если измерение имеет Service различные значения Ls, измерение имеет различные значения, Data centerLdc а измерение Machine имеет Lm различные значения, то (Ls + 1) * (Ldc + 1) * (Lm + 1) в иерархической топологии могут быть сочетания измерений.

Но обычно не все сочетания измерений являются допустимыми, что может значительно снизить сложность. В настоящее время, если пользователи объединяют метрики, количество измерений не ограничивается. Если необходимо использовать функцию свертки, предоставляемую помощником по метрикам, то количество измерений не должно превышать 6. Тем не менее количество временных рядов, развернутых по измерениям для метрик, ограничено до 10 000.

Инструмент дерева диагностики на странице "Диагностика" показывает только те узлы, на которых обнаружена аномалия, а не всю топологию. Это поможет вам сосредоточиться на текущем вопросе. Он также может не отображать все аномалии в пределах метрики, а вместо этого будет отображать основные аномалии на основе вклада. Таким образом, мы можем быстро определить влияние, область и путь распределения аномальных данных. Что значительно сокращает количество аномалий, на которых необходимо сосредоточиться, и помогает пользователям понять и определить основные проблемы.

Например, при возникновении аномалии в Service = S2 | Data Center = DC2 | Machine = M5 отклонение аномалии влияет на родительский узел Service= S2, который также обнаружил аномалию, но аномалия не влияет на весь центр обработки данных в DC2 и все службы в M5. Дерево инцидентов будет построено, как показано на снимке экрана ниже, Service = S2 и основная причина может быть проанализирована в двух путях, в которых они ведут Service = S2 | Data Center = DC2 | Machine = M5.

5 labeled vertices with two distinct paths connected by edges with a common node labeled S2. The top anomaly is captured on Service = S2, and root cause can be analyzed by the two paths which both lead to Service = S2 | Data Center = DC2 | Machine = M5