Поделиться через


Справочник по данным мониторинга Управляемого Redis в Azure

В этой статье содержатся все справочные сведения о мониторинге для этой службы.

Метрики

В этом разделе перечислены все автоматически собранные метрики платформы для этой службы. Эти метрики также являются частью глобального списка всех метрик платформы, поддерживаемых в Azure Monitor.

Сведения о хранении метрик вы можете найти в разделе Обзор метрик Azure Monitor.

Дополнительные сведения и сведения о поддерживаемых метрик для Microsoft.Cache/redisEnterprise см. в следующем разделе.

Поддерживаемые метрики для Microsoft.Cache/redisEnterprise

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.Cache/redisEnterprise.

  • Все столбцы могут не присутствовать в каждой таблице.
  • Некоторые столбцы могут находиться за пределами области просмотра страницы. Выберите "Развернуть таблицу ", чтобы просмотреть все доступные столбцы.

Заголовки таблиц

  • Категория — группа метрик или классификация.
  • Metric - Название метрики, как оно отображается в портале Azure.
  • Имя в REST API — имя метрики, указанное в REST API.
  • Единица измерения.
  • Аггрегация - Тип агрегации по умолчанию. Допустимые значения: среднее (среднее), минимальное (минимальное), максимальное (максимальное), общее (сумма), число.
  • Измерения - Размеры, доступные для данной метрики.
  • Интервалы интервалов - времени, по которым выборка метрики выполняется. Например, PT1M указывает, что метрика измеряется каждую минуту, PT30M — каждые 30 минут, PT1H — каждый час и так далее.
  • Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики. Сведения об экспорте метрик см. в статье "Создание параметров диагностики" в Azure Monitor.
Единица измерения Название в REST API Единица Аггрегация Измерения Гранулы времени Экспорт данных (DS)
Кэш-хиты

Количество успешных поисков ключа. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
cachehits Численность Сумма (Итог) <нет> PT5M, PT1H Да
Микросекунды задержки кэша (предварительная версия)

Задержка кэша в микросекундах. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
cacheLatency Численность Среднее значение InstanceId PT5M, PT1H Да
Промахи в кэше-памяти

Количество неудачных операций поиска ключа. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
cachemisses Численность Сумма (Итог) <нет> PT5M, PT1H Да
Чтение из кэша

Объем данных, читаемых из кэша, в мегабайтах в секунду (МБ/с). Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
cacheRead Байт в секунду Максимум InstanceId PT5M, PT1H Да
Запись в кэш

Объем данных, записываемых в кэш, в мегабайтах в секунду (МБ/с). Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
cacheWrite Байт в секунду Максимум InstanceId PT5M, PT1H Да
Подключенные клиенты

Число клиентских подключений к кэшу. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
connectedclients Численность Максимум InstanceId PT5M, PT1H Да
Удаленные ключи

Число извлеченных из кэша элементов. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
evictedkeys Численность Сумма (Итог) <нет> PT5M, PT1H Да
Истекшие ключи

Число истёкших элементов в кэше. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
expiredkeys Численность Сумма (Итог) <нет> PT5M, PT1H Да
Георепликация в норме

Состояние георепликации в активной группе георепликации. 0 означает нездоровый, а 1 означает здоровый. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
geoReplicationHealthy Численность Максимум <нет> PT5M, PT1H Да
Получает

Число операций получения из кэша. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
getcommands Численность Сумма (Итог) <нет> PT5M, PT1H Да
Количество операций в секунду

Количество мгновенных операций в секунду, выполняемых в кэше. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
operationsPerSecond Численность Максимум <нет> PT5M, PT1H Да
процессор

Использование ресурсов ЦП сервером кэша Redis для Azure (в виде процентной доли). Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
percentProcessorTime Процент Максимум InstanceId PT5M, PT1H Да
Загрузка сервера

Процентная доля циклов, в течение которых сервер Redis занят обработкой и не находится в неактивном состоянии, ожидая поступления сообщений. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
serverLoad Процент Максимум <нет> PT5M, PT1H Да
Наборы

Количество установленных операций в кэше. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
setcommands Численность Сумма (Итог) <нет> PT5M, PT1H Да
Всего операций

Общее число команд, обработанных сервером кэша. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
totalcommandsprocessed Численность Сумма (Итог) <нет> PT5M, PT1H Да
Всего ключей

Общее число элементов в кэше. Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
totalkeys Численность Максимум <нет> PT5M, PT1H Да
Объем используемой памяти

Объем памяти кэша, используемой для хранения пар "ключ — значение" (в МБ). Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
usedmemory Байт Максимум <нет> PT5M, PT1H Да
Процент используемой памяти

Процент памяти кэша, используемый для пар "ключ — значение". Дополнительные сведения см. в статье https://aka.ms/redis/enterprise/metrics.
usedmemorypercentage Процент Максимум <нет> PT5M, PT1H Да

Сведения о метриках Управляемого Redis в Azure

В следующем списке содержатся сведения и дополнительные сведения о поддерживаемых метриках Azure Monitor для Microsoft.Cache/redisEnterprise.

Единица измерения Сведения
Задержка кэша (предварительная версия) Средняя задержка запросов, обрабатываемых конечными точками на узле кэша в течение указанного интервала отчетности. Эта метрика измеряется в миллисекундах и получена из node_avg_latency метрики Prometheus. Эта метрика сообщается только при наличии активного трафика в кэше.
Попадания в кэш Количество успешных подстановок ключей во время указанного интервала отчетности. Это значение создается из bdb_read_hits метрики Prometheus.
Промахи в кэше Количество неудачных операций поиска по ключу за указанный интервал отчетности. Это значение создается из bdb_read_misses_max метрики Prometheus. Промахи в кэше не всегда означают, что с кэшем возникли какие-то неполадки. Например, при использовании шаблона программирования "Отдельно от кэша" приложение сначала ищет элемент в кэше. Если он там отсутствует (то есть фиксируется промах), элемент извлекается из базы данных и добавляется в кэш. Промахи в кэше – нормальное явление для программирования на базе шаблона "Отдельно от кэше". Если количество промахов в кэше больше, чем предполагается, проанализируйте алгоритм приложения, который заполняет кэш и считывает оттуда значения. Если элементы вытеснили из кэша из-за нехватки памяти, то может возникнуть некоторые промахи кэша, но более эффективная метрика для отслеживания давления памяти будет Used Memory or Evicted Keys.
Чтение из кэша Скорость входящего сетевого трафика к узлу кэша в байтах в секунду во время указанного интервала отчетности. Это значение создается из node_ingress_bytes_max метрики Prometheus. Если вы хотите настроить оповещения для ограничений пропускной способности сети на стороне сервера, создайте его с помощью этого счетчика чтения кэша. См . эту таблицу для наблюдаемых ограничений пропускной способности для различных ценовых категорий кэша и размеров.
Запись в кэш Скорость исходящего сетевого трафика с узла кэша в байтах в секунду во время указанного интервала отчетности. Это значение создается из node_egress_bytes_max метрики Prometheus.
Подключенные клиенты Количество подключенных к кэшу клиентов за указанный интервал отчетности. Это значение создается из node_conns метрики Prometheus, которая подсчитывает клиенты, подключенные к конечным точкам узла. После достижения ограничения подключения позже пытается подключиться к кэшу. Даже если нет активных клиентских приложений, возможно, существует несколько экземпляров подключенных клиентов из-за внутренних процессов и подключений.
ЦП Использование ЦП управляемого сервера Redis Azure в процентах в течение указанного интервала отчетности. Это значение является производным от node_cpu_idle_min метрики Prometheus, которая представляет самую низкую часть времени простоя ЦП, наблюдаемую в течение интервала, и инвертируется для отражения времени загрузки ЦП. Метрика ЦП включает фоновые процессы, такие как антивредоносные программы, которые не являются строго процессами сервера Redis, поэтому иногда они могут резко повыситься независимо от рабочей нагрузки Redis. Мы рекомендуем использовать эту метрику по сравнению с нагрузкой сервера для мониторинга, так как она поддерживает детализацию на уровне экземпляра путем разделения на идентификатор экземпляра, обеспечивая более подробную степень детализации, в которой находится узел под давлением.
Исключенные ключи Количество ключей, вытеснили из кэша во время указанного интервала отчетности. Это значение создается из bdb_evicted_objects метрики Prometheus.
Ключи с истекшим сроком действия Количество ключей истекло из кэша во время указанного интервала отчетности. Это значение создается из bdb_expired_objects метрики Prometheus.
Георепликация работоспособна Указывает работоспособность связи георепликации между кэшами в группе "Активные Geo-Replication". Метрика сообщает одно из двух значений:

0 — отключено или неработоспособно
1 — здоровый

Эта метрика доступна в кэшах оптимизированных для памяти, балансированных и оптимизированных для вычислений уровней с поддержкой георепликации. Значение 0 не означает, что данные геореплики теряются. Это просто означает, что связь между гео-первичным и гео-вторичным является неработоспособной.

Эта метрика может указывать на состояние отключенной или неработоспособной репликации по нескольким причинам, включая ежемесячные исправления, обновления ОС узла, неправильное настройку сети или сбой подготовки канала георепликации. Служба Управляемого Redis Azure периодически обновляет кэши с последними функциями платформы и улучшениями. Во время этих обновлений каждый узел кэша принимается в автономный режим, который временно отключает ссылку георепликации. Если ссылка георепликации неработоспособна, проверьте, вызвана ли она событием исправления в гео-первичном или гео-вторичном кэше с помощью меню "Диагностика и устранение проблем " на портале. В зависимости от объема данных в кэше время простоя от исправления может занять от нескольких минут до часа. Если ссылка георепликации неработоспособна более часа, отправьте запрос в службу поддержки.
Операций считывания Количество запросов на чтение в кэш во время указанного интервала отчетности. Это значение создается из bdb_read_req метрики Prometheus, которая представляет частоту всех запросов на чтение в базе данных и эквивалентна сумме попаданий кэша и пропускается в течение интервала отчетности.
Количество операций в секунду Общее количество запросов, обрабатываемых в секунду всеми сегментами кэша в течение указанного интервала отчетности. Это значение создается из bdb_instantaneous_ops_per_sec метрики Prometheus.
Загрузка сервера Метрика загрузки сервера отражает собственную оценку общей нагрузки сервера Redis и похожа на метрику ЦП , но измеряется на уровне кластера, а не на экземпляр. Это значение является производным от node_cpu_idle_min метрики Prometheus и включено для отражения времени занятого сервера. Если этот счетчик достигает 100, сервер Redis достиг потолка производительности, и ЦП не может работать быстрее. Вы можете ожидать большого эффекта задержки. Если вы видите устойчивую высокую нагрузку сервера, рассмотрите возможность масштабирования кэша или секционирования данных в нескольких кэшах. Если загрузка сервера только умеренно высока, например 50–80 процентов, средняя задержка обычно остается низкой, а исключения времени ожидания могут иметь другие причины, чем высокая задержка сервера.

Так как загрузка сервера измеряется на уровне кластера, она не позволяет детализировать отдельные экземпляры. Вместо этого рекомендуется использовать метрику ЦП , так как она поддерживает разделение по идентификатору экземпляра для анализа на уровне экземпляра.

Осторожностью: Метрика загрузки сервера может представлять неверные данные для кэшей Управляемых Redis Для Azure. Иногда загрузка сервера представлена как более 100. Мы анализируем эту проблему. Вместо этого рекомендуется использовать метрику ЦП .
Наборы Количество запросов на запись в кэш во время указанного интервала отчетности. Это значение создается из bdb_write_req метрики Prometheus, которая представляет частоту всех запросов на запись в базе данных.
Всего ключей Количество ключей в кэше во время указанного интервала отчетности. Это значение создается из bdb_no_of_keys метрики Prometheus.

Важно: Из-за ограничения в базовой системе метрик для кэшей с включенной кластеризированием общее число ключей возвращает максимальное количество ключей сегмента, которое имело максимальное количество ключей во время интервала отчетности.
Всего операций Общее количество запросов, обрабатываемых кэшем в течение указанного интервала отчетности. Это значение создается из bdb_total_req метрики Prometheus.
Объем используемой памяти Объем памяти кэша в байтах, используемых базой данных в течение указанного интервала отчетности. Это значение создается из bdb_used_memory метрики Prometheus. В кэшах оптимизированных для флэш-памяти это значение включает как ОЗУ, так и использование памяти флэш-памяти. Это значение не включает фрагментацию.

Если включена высокая доступность, значение используемой памяти включает память как в первичных, так и на узлах реплики. Это может сделать метрику в два раза больше, чем ожидалось.
Процент используемой памяти Процент настроенного ограничения памяти, используемого в настоящее время в течение указанного интервала отчетности. Это значение вычисляется как отношение bdb_used_memory к bdb_memory_limit метрикам Redis Enterprise Prometheus. Это значение не включает фрагментацию.

Журналы ресурсов

В этом разделе перечислены типы журналов ресурсов, которые можно собирать для этой службы. Раздел извлекает из списка всех типов категорий журналов ресурсов, поддерживаемых в Azure Monitor.

Поддерживаемые журналы ресурсов для Microsoft.Cache/redisEnterprise/database

Категория Название отображаемой категории таблица логов Поддерживает базовую схему ведения журнала Поддерживает преобразования во время приема данных Примеры запросов Стоимость экспорта
ConnectionEvents События подключения (новое подключение, проверка подлинности и отключение) REDConnectionEvents

Регистрирует события подключения при подключении клиента к корпоративной базе данных Redis.

Да Да Запросы Да

Таблицы журналов Azure Monitor

В этом разделе перечислены таблицы журналов Azure Monitor, относящиеся к этой службе, которые доступны для запроса Log Analytics с помощью запросов Kusto. Таблицы содержат данные журнала ресурсов и, возможно, больше в зависимости от собираемых и перенаправленных к ним данных.

Управляемый Redis в Azure

Microsoft.Cache/redisEnterprise

Журнал действий

В связанной таблице перечислены операции, которые можно записать в журнале действий для этой службы. Эти операции представляют собой подмножество всех возможных операций поставщика ресурсов в журнале действий.

Дополнительные сведения о схеме записей журнала действий см . в схеме журнала действий.