Мониторинг службы Azure Kubernetes (AKS)

2025-04-30

В этой статье рассматриваются следующие вопросы:

Типы данных мониторинга, которые можно собирать для этой службы.
Способы анализа данных.

Примечание.

Если вы уже знакомы с этой службой и (или) Azure Monitor и просто хотите знать, как анализировать данные мониторинга, см . раздел "Анализ " в конце этой статьи.

При наличии критически важных приложений и бизнес-процессов, использующих ресурсы Azure, необходимо отслеживать и получать оповещения для системы. Служба Azure Monitor собирает и агрегирует метрики и журналы из каждого компонента системы. Azure Monitor предоставляет представление о доступности, производительности и устойчивости, а также уведомляет вас о проблемах. Вы можете использовать портал Azure, PowerShell, Azure CLI, REST API или клиентские библиотеки для настройки и просмотра данных мониторинга.

Дополнительные сведения об Azure Monitor см. в обзоре Azure Monitor.
Дополнительные сведения о том, как отслеживать ресурсы Azure в целом, см. в статье "Мониторинг ресурсов Azure" с помощью Azure Monitor.

Внимание

Kubernetes — это сложная распределенная система со многими движущимися частями. Требуется мониторинг на нескольких уровнях. Хотя AKS является управляемой службой Kubernetes, одна и та же строгость мониторинга на нескольких уровнях по-прежнему требуется. В этой статье содержатся общие сведения и рекомендации по мониторингу кластера AKS.

Подробный мониторинг полного стека Kubernetes см. в статье "Мониторинг кластеров Kubernetes" с помощью служб Azure и облачных средств.
Сведения о сборе данных метрик из кластеров Kubernetes см. в управляемой службе Azure Monitor для Prometheus.
Сведения о сборе журналов в кластерах Kubernetes см. в функциях Azure Monitor для мониторинга Kubernetes.
Сведения о визуализации данных см . в книгах Azure и мониторинге служб Azure в Grafana.

Аналитические выводы (Insights)

Некоторые службы в Azure имеют встроенную панель мониторинга в портал Azure, которая предоставляет отправную точку для мониторинга службы. Эти панели мониторинга называются аналитическими сведениями, и их можно найти в Центре аналитики Azure Monitor в портал Azure.

Аналитика контейнеров Azure Monitor собирает пользовательские метрики для узлов, модулей pod, контейнеров и постоянных томов. Дополнительные сведения см. в разделе "Метрики", собранные аналитикой контейнеров.

Azure Monitor Application Insights используется для мониторинга производительности приложений (APM). Сведения о включении Application Insights с изменениями кода см. в статье "Включить Azure Monitor OpenTelemetry". Сведения о включении Application Insights без изменений кода см. в статье автоинструментация AKS. Дополнительные сведения о инструментировании см. в основах сбора данных.

Данные мониторинга

AKS создает те же типы данных мониторинга, что и другие ресурсы Azure, описанные в разделе "Мониторинг данных из ресурсов Azure". Дополнительные сведения о метриках и журналах, созданных AKS, см . в справочнике по данным мониторинга AKS. Другие службы и функции Azure собирают другие данные и обеспечивают другие параметры анализа, как показано на следующей схеме и таблице.

Оригинал	Описание
Метрики платформы	Метрики платформы автоматически собираются для кластеров AKS без затрат. Эти метрики можно проанализировать с помощью обозревателя метрик или использовать их для оповещений метрик.
Метрики Prometheus	Если включить очистку метрик для кластера, управляемая служба Azure Monitor для Prometheus собирает метрики Prometheus и сохраняет их в рабочей области Azure Monitor. Анализируйте их с помощью предварительно созданных панелей мониторинга в Управляемой Grafana Azure и с помощью оповещений Prometheus.
Журналы действий	Журнал действий собирается автоматически для кластеров AKS без затрат. Эти журналы отслеживают такие сведения, как при создании кластера или изменении конфигурации. Чтобы проанализировать его с другими данными журнала, отправьте журнал действий в рабочую область Log Analytics.
Журналы ресурсов	Журналы плоскости управления для AKS реализуются в виде журналов ресурсов. Создайте параметр диагностики для отправки их в рабочую область Log Analytics, где можно анализировать и оповещать их с помощью запросов журналов в Log Analytics.
Аналитика контейнеров	Аналитика контейнеров собирает различные журналы и данные о производительности из кластера, включая потоки stdout/stderr, и храните их в рабочей области Log Analytics и метриках Azure Monitor. Анализ этих данных с помощью представлений и книг, включенных в аналитику контейнеров или с помощью обозревателя метрик Log Analytics и метрик.
Application Insights	Azure Monitor Application Insights собирает журналы, метрики и распределенные трассировки. Эта телеметрия хранится в рабочей области Log Analytics для анализа в портал Azure.

Типы ресурсов

Azure использует концепцию типов ресурсов и идентификаторов для идентификации всего в подписке. Типы ресурсов также являются частью идентификаторов ресурсов для каждого ресурса, работающего в Azure. Например, для виртуальной машины используется Microsoft.Compute/virtualMachinesодин тип ресурса. Список служб и связанных с ними типов ресурсов см. в разделе "Поставщики ресурсов".

Azure Monitor аналогично упорядочивает основные данные мониторинга в метрики и журналы на основе типов ресурсов, которые также называются пространствами имен. Различные метрики и журналы доступны для различных типов ресурсов. Служба может быть связана с несколькими типами ресурсов.

Дополнительные сведения о типах ресурсов для AKS см. в Служба Azure Kubernetes справочнике по данным мониторинга.

Хранилище данных

Для Azure Monitor:

Данные метрик хранятся в базе данных метрик Azure Monitor.
Данные журнала хранятся в хранилище журналов Azure Monitor. Log Analytics — это средство в портал Azure, которое может запрашивать это хранилище.
Журнал действий Azure — это отдельное хранилище с собственным интерфейсом в портал Azure.

При необходимости можно перенаправить данные журнала метрик и действий в хранилище журналов Azure Monitor. Затем с помощью Log Analytics можно запрашивать данные и сопоставлять их с другими данными журнала.

Многие службы могут использовать параметры диагностики для отправки данных метрик и журналов в другие расположения хранилища за пределами Azure Monitor. Примеры включают служба хранилища Azure, размещенные партнерские системы и системы партнеров, отличные от Azure, с помощью Центров событий.

Подробные сведения о том, как Azure Monitor хранит данные, см. на платформе данных Azure Monitor.

Метрики платформы Azure Monitor

Azure Monitor предоставляет метрики платформы для большинства служб. Эти метрики перечислены ниже.

По отдельности определяется для каждого пространства имен.
Хранится в базе данных метрик временных рядов Azure Monitor.
Упрощенный и способный поддерживать оповещения практически в режиме реального времени.
Используется для отслеживания производительности ресурса с течением времени.

Коллекция: Azure Monitor автоматически собирает метрики платформы. Настройка не требуется.

Маршрутизация. Вы также можете направлять некоторые метрики платформы в журналы Azure Monitor или Log Analytics, чтобы запросить их с другими данными журнала. Проверьте параметр экспорта DS для каждой метрики, чтобы узнать, можно ли использовать параметр диагностики для маршрутизации метрик в журналы Azure Monitor или Log Analytics.

Дополнительные сведения см. в параметре диагностики метрик.
Сведения о настройке параметров диагностики для службы см. в статье "Создание параметров диагностики" в Azure Monitor.

Список всех метрик, которые можно собрать для всех ресурсов в Azure Monitor, см. в статье "Поддерживаемые метрики в Azure Monitor".

Список доступных метрик для AKS см. в Служба Azure Kubernetes справочнике по данным мониторинга.

Метрики играют важную роль в мониторинге кластера, выявлении проблем и оптимизации производительности в кластерах AKS. Метрики платформы записываются с помощью сервера метрик, установленного в пространстве имен kube-system, которое периодически ломает метрики от всех узлов Kubernetes, обслуживаемых Kubelet. Кроме того, следует включить метрики Управляемого prometheus Azure для сбора метрик контейнеров и метрик объектов Kubernetes, таких как состояние объектов deployments. Дополнительные сведения см. в разделе "Сбор метрик Prometheus" из кластера AKS.

Список метрик Prometheus по умолчанию

AKS также предоставляет метрики из критических компонентов уровня управления, таких как сервер API, ETCD, планировщик через Управляемый Prometheus Azure. Эта функция в настоящее время доступна для предварительного ознакомления. Дополнительные сведения см. в разделе "Мониторинг Служба Azure Kubernetes (AKS) метрики плоскости управления (предварительная версия)". Подмножество метрик уровня управления для сервера API и ETCD доступно бесплатно с помощью метрик платформы Azure Monitor. Эти метрики собираются по умолчанию и могут использоваться для создания оповещений на основе метрик.

Метрики, отличные от Azure Monitor

Эта служба предоставляет другие метрики, которые не включены в базу данных метрик Azure Monitor.

Следующие службы и функции Azure Monitor можно использовать для дополнительного мониторинга кластеров Kubernetes. Эти функции можно включить во время создания кластера AKS на вкладке "Интеграция" в портал Azure, Azure CLI, Terraform, Политика Azure или подключить кластер к ним позже. Каждая из этих функций может повлечь за собой затраты, поэтому ознакомьтесь с сведениями о ценах для каждого из них, прежде чем включить их.

Служба, компонент или функция	Описание
Аналитика контейнеров	Использует контейнерную версию агента Azure Monitor для сбора журналов stdout/stderr и событий Kubernetes из каждого узла в кластере. Эта функция поддерживает различные сценарии мониторинга для кластеров AKS. Мониторинг кластера AKS можно включить при создании с помощью Azure CLI, Политика Azure, портал Azure или Terraform. Если при создании кластера не включить аналитику контейнеров, см. статью "Включить аналитику контейнеров" для кластера Служба Azure Kubernetes (AKS), чтобы включить его. Аналитика контейнеров хранит большую часть своих данных в рабочей области Log Analytics и обычно использует ту же рабочую область Log Analytics, что и журналы ресурсов для кластера. Ознакомьтесь с архитектурой рабочей области Log Analytics, чтобы узнать, сколько рабочих областей следует использовать и где их найти.
Управляемая служба Azure Monitor для Prometheus	Prometheus — это облачное решение метрик из Cloud Native Compute Foundation. Это наиболее распространенный инструмент, используемый для сбора и анализа данных метрик из кластеров Kubernetes. Управляемая служба Azure Monitor для Prometheus — это полностью управляемое решение для мониторинга, совместимое с Prometheus в Azure. Если вы не включите управляемый Prometheus при создании кластера, ознакомьтесь с метриками Сбора метрик Prometheus из кластера AKS для других параметров, чтобы включить его. Управляемая служба Azure Monitor для Prometheus хранит свои данные в рабочей области Azure Monitor, которая связана с рабочей областью Grafana, чтобы вы могли анализировать данные с помощью Управляемой Grafana Azure.
Управляемая Grafana Azure	Полностью управляемая реализация Grafana, которая является платформой визуализации данных с открытым исходным кодом, обычно используемой для представления данных Prometheus. Для мониторинга Kubernetes и устранения неполадок с полным стеком доступны несколько предопределенных панелей мониторинга Grafana. Если вы не включите управляемый Grafana при создании кластера, см. статью "Ссылка на рабочую область Grafana". Вы можете связать его с рабочей областью Azure Monitor, чтобы получить доступ к метрикам Prometheus для кластера.

Мониторинг метрик плоскости управления AKS (предварительная версия)

Журналы ресурсов Azure Monitor

Журналы ресурсов предоставляют аналитические сведения об операциях, выполненных ресурсом Azure. Журналы создаются автоматически, но их необходимо перенаправить в журналы Azure Monitor, чтобы сохранить или запросить их. Журналы организованы по категориям. Заданное пространство имен может содержать несколько категорий журналов ресурсов.

Коллекция. Журналы ресурсов не собираются и хранятся, пока не создадите параметр диагностики и перенаправите журналы в одно или несколько расположений. Создавая параметр диагностики, нужно указать, какие категории журналов должны собираться. Существует несколько способов создания и обслуживания параметров диагностики, включая портал Azure, программно и хотя Политика Azure.

Маршрутизация: рекомендуемая по умолчанию — маршрутизация журналов ресурсов в журналы Azure Monitor, чтобы запросить их с другими данными журнала. Также доступны другие расположения, такие как служба хранилища Azure, Центры событий Azure и некоторые партнеры по мониторингу Майкрософт. Дополнительные сведения см. в журналах ресурсов Azure и назначениях журналов ресурсов.

Подробные сведения о сборе, хранении и маршрутизации журналов ресурсов см. в разделе "Параметры диагностики" в Azure Monitor.

Список всех доступных категорий журналов ресурсов в Azure Monitor см. в статье "Поддерживаемые журналы ресурсов" в Azure Monitor.

Все журналы ресурсов в Azure Monitor имеют одинаковые поля заголовков, а затем поля для конкретной службы. Общая схема показана в разделе Схема журнала ресурсов Azure Monitor.

Доступные категории журналов ресурсов, связанные таблицы Log Analytics и схемы журналов для AKS, см. в Служба Azure Kubernetes справочнике по данным мониторинга.

Плоскость управления AKS или журналы ресурсов

Журналы плоскости управления для кластеров AKS реализуются в виде журналов ресурсов в Azure Monitor. Журналы ресурсов не собираются и хранятся, пока не создадите параметр диагностики для их маршрутизации в одно или несколько расположений. Обычно они отправляются в рабочую область Log Analytics, где хранится большая часть данных для аналитики контейнеров.

Дополнительные сведения о создании параметра диагностики см. в статье "Создание параметров диагностики" с помощью портал Azure, CLI или PowerShell. Создавая параметр диагностики, нужно указать, какие категории журналов должны собираться. Категории для AKS перечислены в справочнике по данным мониторинга AKS.

Внимание

При сборе журналов ресурсов для AKS может быть существенное значение, особенно для журналов аудита kube. Рассмотрим следующие рекомендации, чтобы уменьшить объем собранных данных:

Отключите ведение журнала аудита kube, если не требуется.
Включите сбор данных от kube-audit-admin, который исключает события аудита типа get и list.
Включите журналы, относящиеся к ресурсам, как описано здесь, и настройте AKSAudit таблицу в качестве базовых журналов.

Дополнительные рекомендации и оптимизацию затрат см. в статье "Мониторинг кластеров Kubernetes" с помощью служб Azure и облачных средств для оптимизации затрат и Azure Monitor для дальнейшего сокращения затрат на мониторинг.

AKS поддерживает режим диагностика Azure или режим, зависящий от ресурса, для журналов ресурсов. Этот режим указывает таблицы в рабочей области Log Analytics, в которой отправляются данные. Режим диагностика Azure отправляет все данные в таблицу AzureDiagnostics, а режим для конкретных ресурсов отправляет данные в AKS Audit, AKS Audit Admin и AKS Control Plane, как показано в таблице в журналах ресурсов.

Для AKS рекомендуется использовать режим для конкретного ресурса по следующим причинам:

Данные проще запрашивать, так как они содержатся в отдельных таблицах, предназначенных для AKS.
Поддерживает конфигурацию как базовые журналы для значительной экономии затрат.

Дополнительные сведения о различиях между режимами сбора, включая изменение существующего параметра, см. в разделе "Выбор режима коллекции".

Примечание.

Также можно настроить параметры диагностики с помощью интерфейса командной строки. В таких случаях он не гарантирует успешной работы, так как он не проверяет состояние подготовки кластера. Обязательно проверьте параметры диагностики кластера, чтобы отразиться после его настройки.

az monitor diagnostic-settings create --name AKS-Diagnostics --resource /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourceGroups/myresourcegroup/providers/Microsoft.ContainerService/managedClusters/my-cluster --logs '[{"category": "kube-audit","enabled": true}, {"category": "kube-audit-admin", "enabled": true}, {"category": "kube-apiserver", "enabled": true}, {"category": "kube-controller-manager", "enabled": true}, {"category": "kube-scheduler", "enabled": true}, {"category": "cluster-autoscaler", "enabled": true}, {"category": "cloud-controller-manager", "enabled": true}, {"category": "guard", "enabled": true}, {"category": "csi-azuredisk-controller", "enabled": true}, {"category": "csi-azurefile-controller", "enabled": true}, {"category": "csi-snapshot-controller", "enabled": true}]'  --workspace /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourcegroups/myresourcegroup/providers/microsoft.operationalinsights/workspaces/myworkspace --export-to-resource-specific true

Пример запросов журнала

Внимание

При выборе журналов из меню кластера AKS log Analytics открывается с областью запроса, заданной для текущего кластера. Это означает, что запросы к журналам будут содержать данные только из этого ресурса. Если вы хотите выполнить запрос, содержащий данные из других кластеров или данных из других служб Azure, выберите "Журналы" в меню Azure Monitor. Подробные сведения см. в статье Область запросов журнала и временной диапазон в Azure Monitor Log Analytics.

Если параметр диагностики для кластера использует режим azure диагностика, журналы ресурсов для AKS хранятся в таблице AzureDiagnostics. Вы можете отличить один журнал от другого по столбцу Категория. Описание каждой категории см. в справочнике по журналам ресурсов AKS.

Описание	Запрос журнала
Подсчет журналов для каждой категории (Режим диагностика Azure)	AzureDiagnostics \| where ResourceType == "MANAGEDCLUSTERS" \| суммирование count() по категориям
Все журналы сервера API (Режим диагностика Azure)	AzureDiagnostics \| Where Category == "kube-apiserver"
Все журналы аудита kube в диапазоне времени (Режим диагностика Azure)	let starttime = datetime("2023-02-23"); let endtime = datetime("2023-02-24"); AzureDiagnostics \| where TimeGenerated между(starttime.). endtime) \| Where Category == "kube-audit" \| событие extend = parse_json(log_s) \| расширение HttpMethod = tostring(event.verb) \| extend User = tostring(event.user.username) \| расширение Apiserver = pod_s \| расширение SourceIP = tostring(event.sourceIPs[0]) \| проект ВремяСоздано, Категория, HttpMethod, Пользователь, Apiserver, SourceIP, ОперацияИмя, событие
Все журналы аудита (режим, зависящий от ресурса)	AKSAudit
Все журналы аудита, за исключением событий аудита получения и списка (режим, зависящий от ресурса)	AKSAuditAdmin
Все журналы сервера API (режим, зависящий от ресурса)	AKSControlPlane \| Where Category == "kube-apiserver"

Чтобы получить доступ к набору предварительно созданных запросов в рабочей области Log Analytics, ознакомьтесь с интерфейсом запросов Log Analytics и выберите тип ресурсов Kubernetes Services. Список распространенных запросов для аналитики контейнеров см . в разделе "Запросы аналитики контейнеров".

Плоскость данных AKS и журналы Container Insights

Container Insights собирает различные типы данных телеметрии из контейнеров и кластеров Kubernetes, чтобы помочь вам отслеживать, устранять неполадки и получать аналитические сведения о контейнерных приложениях, работающих в кластерах AKS. Список таблиц с подробными описаниями, используемыми службой аналитики контейнеров, представлен в справочнике по таблицам Azure Monitor. Все эти таблицы доступны для запросов журналов.

Параметры оптимизации затрат позволяют настраивать и управлять данными метрик, собранными с помощью агента аналитики контейнеров. Эта функция поддерживает параметры сбора данных для выбора отдельных таблиц, интервалов сбора данных и пространств имен, чтобы исключить сбор данных с помощью правил сбора данных Azure Monitor (DCR). Эти параметры управляют объемом приема и сокращают затраты на мониторинг аналитических сведений о контейнерах. Собранные данные аналитики контейнеров можно настроить с помощью портал Azure, используя следующие параметры. Выбор любых параметров, отличных от всех (по умолчанию), приводит к тому, что аналитика контейнеров становится недоступной.

Группировка	Таблицы	Примечания.
Все (по умолчанию)	Все стандартные таблицы аналитики контейнеров	Требуется для включения визуализаций аналитики контейнеров по умолчанию
Производительность	Перф, InsightsMetrics
Журналы и события	ContainerLog или ContainerLogV2, KubeEvents, KubePodInventory	Рекомендуется, если вы включили управляемые метрики Prometheus
Рабочие нагрузки, развертывания и hpAs	ИнсайтсМетрикс, КубПодИнвентори, КубСобытия, КонтейнерИнвентори, КонтейнерУзелИнвентори, КубУзелИнвентори, КубСервисы
Постоянные тома	InsightsMetrics, KubePVInventory

Журналы и события группирования записывают журналы из таблиц ContainerLog или ContainerLogV2, KubeEvents, KubePodInventory, но не метрик. Рекомендуемый путь для сбора метрик — включить Управляемые службы Azure Monitor Prometheus для Prometheus из кластера AKS и использовать Azure Managed Grafana для визуализации данных. Дополнительные сведения см. в статье Управление рабочей областью в Azure Monitor.

Схема ContainerLogV2

Azure Monitor Container Insights предоставляет схему для журналов контейнеров, известных как ContainerLogV2, что является рекомендуемой возможностью. Этот формат включает следующие поля для упрощения распространенных запросов для просмотра данных, связанных с кластерами AKS и Kubernetes с поддержкой Azure Arc:

ИмяКонтейнера
ПодИмя
PodNamespace

Кроме того, эта схема совместима с планом данных "Базовые журналы ", который предлагает низкую стоимость для стандартных журналов аналитики. План данных журнала "Базовый" позволяет сэкономить на стоимости приема и хранения подробных журналов большого объема в рабочей области Log Analytics для отладки, устранения неполадок и аудита. Это не влияет на затраты на аналитику и оповещения. Дополнительные сведения см. в разделе "Управление таблицами" в рабочей области Log Analytics.

ContainerLogV2 — это рекомендуемый подход и является схемой по умолчанию для клиентов, использующих аналитику контейнеров с помощью проверки подлинности управляемых удостоверений с помощью ARM, Bicep, Terraform, Policy и портал Azure. Дополнительные сведения о включении ContainerLogV2 с помощью правила сбора данных кластера (DCR) или ConfigMap см. в разделе "Включить схему ContainerLogV2".

Журнал действий Azure

Журнал действий содержит события уровня подписки, отслеживающие операции для каждого ресурса Azure, как видно извне этого ресурса; например, создание нового ресурса или запуск виртуальной машины.

Коллекция: события журнала действий автоматически создаются и собираются в отдельном хранилище для просмотра в портал Azure.

Маршрутизация. Вы можете отправлять данные журнала действий в журналы Azure Monitor, чтобы их можно было анализировать вместе с другими данными журнала. Также доступны другие расположения, такие как служба хранилища Azure, Центры событий Azure и некоторые партнеры по мониторингу Майкрософт. Дополнительные сведения о маршрутизации журнала действий см. в разделе "Обзор журнала действий Azure".

Просмотр журналов контейнеров Служба Azure Kubernetes (AKS), событий и метрик pod в режиме реального времени

В этом разделе описано, как использовать функцию динамических данных в Container Insights для просмотра журналов контейнеров Служба Azure Kubernetes (AKS), событий и метрик pod в режиме реального времени. Эта функция обеспечивает прямой доступ к kubectl logs -ckubectl get событиям, событиям и kubectl top pods помогает устранять неполадки в режиме реального времени.

Примечание.

AKS использует архитектуры ведения журнала на уровне кластера Kubernetes. Журналы контейнеров находятся внутри /var/log/containers узла. Сведения о доступе к узлу см. в разделе "Подключение к узлам кластера Служба Azure Kubernetes (AKS).

Сведения о настройке функции динамических данных см. в разделе "Настройка динамических данных" в Container Insights. Эта функция напрямую обращается к API Kubernetes. Дополнительные сведения о модели проверки подлинности см. в API Kubernetes.

Просмотр динамических журналов ресурсов AKS

Примечание.

Чтобы получить доступ к журналам из частного кластера, необходимо быть на компьютере в той же частной сети, что и кластер.

В портал Azure перейдите к кластеру AKS.
В разделе ресурсов Kubernetes выберите рабочие нагрузки.
Выберите развертывание, pod, набор реплик, набор состояния, задание или задание Cron, для которого требуется просмотреть журналы, а затем выберите "Динамические журналы".
Выберите ресурс, для которого нужно просмотреть журналы.

В следующем примере показаны журналы для ресурса Pod :

Просмотр динамических журналов

Вы можете просматривать данные журнала в режиме реального времени, так как подсистема контейнеров создает его в кластере, узлах, контроллерах или контейнерах.

В портал Azure перейдите к кластеру AKS.
В разделе Мониторинг выберите Аналитические сведения.
Выберите вкладку "Кластер", "Узлы", "Контроллеры" или "Контейнеры", а затем выберите объект, для которого нужно просмотреть журналы.
В обзоре ресурса выберите "Динамические журналы".

Примечание.

Чтобы просмотреть данные из рабочей области Log Analytics, выберите "Просмотреть журналы" в Log Analytics. Дополнительные сведения о просмотре журналов, событий и метрик см. в статье "Как запрашивать журналы из Container Insights".

После успешной проверки подлинности, если данные можно получить, он начинает потоковую передачу на вкладку "Динамические журналы". Данные журнала можно просмотреть здесь в непрерывном потоке. На следующем рисунке показаны журналы для ресурса контейнера :

Просмотр трансляций

Данные событий в режиме реального времени можно просматривать в виде ядра контейнеров, создающего его в кластере, узлах, контроллерах или контейнерах.

В портал Azure перейдите к кластеру AKS.
В разделе Мониторинг выберите Аналитические сведения.
Выберите вкладку "Кластер", "Узлы", "Контроллеры" или "Контейнеры", а затем выберите объект, для которого нужно просмотреть события.
На странице обзора ресурсов выберите "Трансляции".

Примечание.

Чтобы просмотреть данные из рабочей области Log Analytics, выберите "Просмотреть события" в Log Analytics. Дополнительные сведения о просмотре журналов, событий и метрик см. в статье "Как запрашивать журналы из Container Insights".

После успешной проверки подлинности, если данные можно получить, он начинает потоковую передачу на вкладку "Трансляции". На следующем рисунке показаны события для ресурса контейнера :

Просмотр метрик

Данные метрик в режиме реального времени можно просматривать в виде обработчика контейнеров, создающего его на узлах или контроллерах, выбрав ресурс Pod.

В портал Azure перейдите к кластеру AKS.
В разделе Мониторинг выберите Аналитические сведения.
Перейдите на вкладку "Узлы " или "Контроллеры ", а затем выберите объект Pod , для которого нужно просмотреть метрики.
На странице обзора ресурсов выберите "Метрики live".

Примечание.

Чтобы просмотреть данные из рабочей области Log Analytics, выберите "Просмотреть события" в Log Analytics. Дополнительные сведения о просмотре журналов, событий и метрик см. в статье "Как запрашивать журналы из Container Insights".

После успешной проверки подлинности, если данные можно получить, он начинает потоковую передачу на вкладку "Метрики трансляции". На следующем рисунке показаны метрики для ресурса Pod :

Анализ данных мониторинга

Существует множество средств для анализа данных мониторинга.

Средства Azure Monitor

Azure Monitor поддерживает следующие основные средства:

Обозреватель метрик— средство в портал Azure, позволяющее просматривать и анализировать метрики для ресурсов Azure. Дополнительные сведения см. в разделе "Анализ метрик" с помощью обозревателя метрик Azure Monitor.
Log Analytics— средство в портал Azure, позволяющее запрашивать и анализировать данные журнала с помощью языка запросов Kusto (KQL). Дополнительные сведения см. в статье Начало работы с запросами журнала в Azure Monitor.
Журнал действий, имеющий пользовательский интерфейс в портал Azure для просмотра и базового поиска. Для более подробного анализа необходимо направлять данные в журналы Azure Monitor и выполнять более сложные запросы в Log Analytics.

Средства, которые позволяют более сложной визуализации, включают:

Панели мониторинга, позволяющие объединить различные виды данных в одну область в портал Azure.
Книги, настраиваемые отчеты, которые можно создать в портал Azure. Книги могут включать текст, метрики и запросы журналов.
Grafana — открытое средство платформы, которое работает на операционных панелях мониторинга. С помощью Grafana можно создавать панели мониторинга, содержащие данные из нескольких источников, отличных от Azure Monitor.
Power BI— служба бизнес-аналитики, которая предоставляет интерактивные визуализации в различных источниках данных. Вы можете настроить Power BI на автоматический импорт данных журналов из Azure Monitor, чтобы воспользоваться этими визуализациями.

Средства экспорта Azure Monitor

Вы можете получить данные из Azure Monitor в другие средства с помощью следующих методов:

Метрики. Используйте REST API для метрик для извлечения данных метрик из базы данных метрик Azure Monitor. API поддерживает выражения фильтров для уточнения полученных данных. Дополнительные сведения см . в справочнике по REST API Azure Monitor.
Журналы: используйте REST API или связанные клиентские библиотеки.
Другим вариантом является экспорт данных рабочей области.

Сведения о начале работы с REST API для Azure Monitor см . в пошаговом руководстве по REST API мониторинга Azure.

Обзорная страница мониторинга на портале Azure

Вкладка "Мониторинг" на странице "Обзор" для ресурса кластера AKS позволяет быстро просматривать данные мониторинга в портал Azure. Эта вкладка содержит графы с общими метриками для кластера, разделенного пулом узлов. Для дальнейшего анализа данных в обозревателе метрик можно выбрать любой из этих графов.

Вкладка "Мониторинг " также содержит ссылки на Managed Prometheus и Container Insights для кластера. Если вам нужно включить эти средства, их можно включить здесь. Вы также можете увидеть баннер в верхней части экрана, который рекомендует включить другие функции для улучшения мониторинга кластера.

Совет

Вы можете получить доступ к функциям мониторинга для всех кластеров AKS в подписке, выбрав Azure Monitor на домашней странице портал Azure.

Запросы Kusto

Данные мониторинга можно анализировать в хранилище журналов Azure Monitor или Log Analytics с помощью языка запросов Kusto (KQL).

Внимание

При выборе журналов в меню службы на портале Log Analytics откроется область запроса, заданная текущей службой. Эта область означает, что запросы журналов будут включать только данные из этого типа ресурса. Если вы хотите выполнить запрос, содержащий данные из других служб Azure, выберите журналы в меню Azure Monitor . Подробные сведения см. в статье Область запросов журнала и временной диапазон в Azure Monitor Log Analytics.

Список распространенных запросов для любой службы см. в интерфейсе запросов Log Analytics.

видны узлы

Оповещения Azure Monitor заранее уведомляют вас о конкретных условиях, обнаруженных в данных мониторинга. Оповещения позволяют выявлять и устранять проблемы в системе, прежде чем клиенты заметят их. Дополнительные сведения см. в оповещениях Azure Monitor.

Существует множество источников распространенных оповещений для ресурсов Azure. Примеры распространенных оповещений для ресурсов Azure см. в примерах запросов оповещений журнала. Сайт базовых оповещений Azure Monitor (AMBA) предоставляет полуавтомативный метод реализации важных оповещений метрик платформы, панелей мониторинга и рекомендаций. Сайт применяется к постоянно расширяющемуся подмножество служб Azure, включая все службы, которые являются частью целевой зоны Azure (ALZ).

Общая схема оповещений стандартизирует потребление уведомлений об оповещениях Azure Monitor. Дополнительные сведения см. в разделе "Общая схема оповещений".

Типов оповещений

Вы можете получать оповещения о любых источниках данных метрик или журналов на платформе данных Azure Monitor. Существует множество различных типов оповещений в зависимости от служб, которые вы отслеживаете, и данных мониторинга, которые вы собираете. Различные типы оповещений имеют различные преимущества и недостатки. Дополнительные сведения см. в разделе "Выбор правильного типа оповещений мониторинга".

В следующем списке описаны типы оповещений Azure Monitor, которые можно создать:

Оповещения метрик оценивают метрики ресурсов через регулярные интервалы. Метрики могут быть метриками платформы, пользовательскими метриками, журналами из Azure Monitor, преобразованными в метрики или метриками Application Insights. Оповещения метрик также могут применять несколько условий и динамические пороговые значения.
Оповещения журнала позволяют пользователям использовать запрос Log Analytics для оценки журналов ресурсов на предопределенной частоте.
Оповещения журнала действий активируются при возникновении нового события журнала действий, соответствующего определенным условиям. Работоспособность ресурсов оповещения и оповещения о работоспособности служб — это оповещения журнала действий, которые сообщают о работоспособности службы и ресурсов.

Некоторые службы Azure также поддерживают оповещения интеллектуального обнаружения, оповещения Prometheus или рекомендуемые правила генерации оповещений.

Для некоторых служб можно отслеживать масштаб, применяя одно правило генерации оповещений метрик к нескольким ресурсам одного типа, которые существуют в одном регионе Azure. Для каждого отслеживаемого ресурса отправляются отдельные уведомления. Сведения о поддерживаемых службах и облаках Azure см. в статье "Мониторинг нескольких ресурсов с помощью одного правила генерации оповещений".

Оповещения на основе метрик Prometheus

При включении коллекции метрик Prometheus для кластера можно скачать коллекцию рекомендуемых правил генерации оповещений Prometheus. Это скачивание включает следующие правила:

Уровень	видны узлы
Уровень кластера	KubeCPUQuotaOvercommit Квота памяти Kubernetes с переполнением KubeContainerOOMKilledCount KubeClientErrors KubePersistentVolumeFillingUp KubePersistentVolumeInodesFillingUp Ошибки KubePersistentVolume KubeContainerWaiting KubeDaemonSet не запланирован KubeDaemonSetMisScheduled (ошибка неверного расписания DaemonSet в Kubernetes) Kube-квота почти заполнена
Уровень узла	Узел Kube недоступен KubeNodeReadinessFlapping
Уровень pod	KubePVUsageHigh НесоответствиеРепликKubeDeployment Несоответствие_числа_реплик_в_KubeStatefulSet KubeHpaReplicasMismatch KubeHpaMaxedOut KubePodCrashLooping KubeJobStale ПерезапускКонтейнераKubePod СостояниеГотовностиKubePodНизкое KubePodFailedState KubePod не готов по причине контроллера KubeStatefulSetGenerationMismatch KubeJobFailed Высокое среднее значение ЦП контейнера Kubernetes Высокое среднее использование памяти в контейнере Kubernetes Высокая задержка запуска пода Kubelet

Узнайте , как создавать оповещения журналов из Службы "Аналитика контейнеров" и "Как запрашивать журналы из Службы "Аналитика контейнеров". Оповещения журнала могут измерять две различные вещи, которые можно использовать для мониторинга в разных сценариях:

Число результатов: подсчитывает количество строк, возвращаемых запросом, и может использоваться для работы с такими событиями, как журналы событий Windows, системный журнал и исключения приложений.
Вычисление значения: делает вычисление на основе числового столбца и может использоваться для включения любого количества ресурсов. Примером является процент ЦП.

В зависимости от требуемого сценария оповещений необходимо создать запросы журналов, сравнивая dateTime с текущим временем с помощью now оператора и возвращаясь через час. Сведения о создании оповещений на основе журналов см. в статье "Создание оповещений журнала" из аналитики контейнеров.

Правила генерации оповещений AKS

В следующей таблице перечислены некоторые предлагаемые правила генерации оповещений для AKS. Эти оповещения являются лишь примерами. Вы можете задать оповещения для любой метрики, записи журнала или записи журнала действий, указанной в справочнике по данным мониторинга Служба Azure Kubernetes.

Условие	Описание
Процент > использования ЦП 95	Возникает, когда среднее использование ЦП на всех узлах превышает пороговое значение.
Рабочий набор памяти в процентах > от 100	Возникает, когда средний рабочий набор по всем узлам превышает пороговое значение.

Метрики сети узлов

Метрики сети узлов важны для поддержания работоспособного и производительного кластера Kubernetes. Собирая и анализируя данные о сетевом трафике, вы можете получить ценные сведения о работе кластера и выявить потенциальные проблемы, прежде чем они приводят к сбоям или снижению производительности.

Начиная с Kubernetes версии 1.29 метрики сети узлов включены по умолчанию для всех кластеров с включенным Azure Monitor.

Следующие сетевые метрики узлов включены по умолчанию и агрегируются на узел. Все метрики включают метки кластера и экземпляра (имя узла). Эти метрики можно легко визуализировать с помощью панели мониторинга Управляемой Grafana, доступной в Azure Managed Prometheus > Kubernetes > Clusters > Networking.

Метрики уровня узла

Следующие метрики агрегируются для каждого узла. Все метрики включают метки:

cluster
instance (Имя узла)

Цилий
Non-Cilium

Для сценариев плоскости данных Cilium наблюдение за сетями контейнеров предоставляет метрики только для Linux, Windows в настоящее время не поддерживается. Cilium предоставляет несколько метрик, включая указанные ниже метрики, используемые при наблюдении за сетями контейнеров.

Имя метрики	Описание	Дополнительные метки	Линукс	Виндоус
cilium_forward_count_total	Общее число пересылаемых пакетов	`direction`	✅	❌
cilium_forward_bytes_total (общее количество переданных байт Cilium)	Общее число перенаправленных байтов	`direction`	✅	❌
cilium_drop_count_total	Общее число потерянных пакетов	`direction`, `reason`	✅	❌
cilium_drop_bytes_total	Общее число утраченных байтов	`direction`, `reason`	✅	❌

Для сценариев плоскости данных, отличных от Cilium, наблюдение за сетями контейнеров предоставляет метрики для операционных систем Linux и Windows. В таблице ниже приведены различные метрики, созданные.

Примечание.

Из-за обнаруженной ошибки сбросы TCP временно не видны. В результате метрики networkobservability_tcp_flag_counters не будут опубликованы в течение этого периода. Наша команда активно работает над решением этой проблемы, и мы предоставим обновления после реализации исправления. Мы извиняемся за любые неудобства и ценим ваше терпение.

Имя метрики	Описание	Дополнительные метки	Линукс	Виндоус
networkobservability_forward_count	Общее число пересылаемых пакетов	`direction`	✅	✅
наблюдаемость_сети_переданные_байты	Общее число перенаправленных байтов	`direction`	✅	✅
счетчик_отброшенных_пакетов_наблюдаемости_сети	Общее число потерянных пакетов	`direction`, `reason`	✅	✅
СетеваяОбозримость_ОтброшенныеБайты	Общее число утраченных байтов	`direction`, `reason`	✅	✅
состояние_TCP_наблюдаемости_сети	Число активных сокетов TCP в настоящее время по состоянию TCP.	`state`	✅	✅
наблюдаемость_сети_тср_подключение_удаленное	Число активных сокетов TCP в настоящее время по удаленному IP-адресу и порту.	`address` (IP), `port`	✅	❌
наблюдаемость_сети_tcp_статистика_соединений	Статистика TCP-подключения. (например, отложенные ACK, TCPKeepAlive, TCPSackFailures)	`statistic`	✅	✅
счетчики_флагов_tcp_наблюдаемости_сети	Количество tcp-пакетов по флагу.	`flag`	❌	✅
сетеваянаблюдаемость_статистика_ip_подключений	Статистика IP-подключения.	`statistic`	✅	❌
статистика_подключений_UDP_мониторинг_сети	Статистика подключения UDP.	`statistic`	✅	❌
наблюдаемость_сети_активные_UDP_сокеты	Количество текущих активных UDP-сокетов		✅	❌
статистика_интерфейса_наблюдаемости_сети	Статистика интерфейса.	InterfaceName, `statistic`	✅	✅

Для получения подробных метрик уровня Pod и DNS изучите наше предложение по расширенным услугам сетевого взаимодействия контейнеров.

Дополнительные сведения о метриках, журналах и других важных значениях, созданных для AKS, см. в Служба Azure Kubernetes справочнике по данным мониторинга.
Общие сведения о мониторинге ресурсов Azure см. в статье "Мониторинг ресурсов Azure" с помощью Azure Monitor .

Поделиться через

Мониторинг службы Azure Kubernetes (AKS)

Аналитические выводы (Insights)

Данные мониторинга

Типы ресурсов

Хранилище данных

Метрики платформы Azure Monitor

Метрики, отличные от Azure Monitor

Мониторинг метрик плоскости управления AKS (предварительная версия)

Журналы ресурсов Azure Monitor

Плоскость управления AKS или журналы ресурсов

Пример запросов журнала

Плоскость данных AKS и журналы Container Insights

Схема ContainerLogV2

Журнал действий Azure

Просмотр журналов контейнеров Служба Azure Kubernetes (AKS), событий и метрик pod в режиме реального времени

Просмотр динамических журналов ресурсов AKS

Просмотр динамических журналов

Просмотр трансляций

Просмотр метрик

Анализ данных мониторинга

Средства Azure Monitor

Средства экспорта Azure Monitor

Обзорная страница мониторинга на портале Azure

Запросы Kusto

видны узлы

Типов оповещений

Рекомендуемые правила генерации оповещений

Оповещения на основе метрик Prometheus

Правила генерации оповещений AKS

Рекомендации Помощника

Метрики сети узлов

Метрики уровня узла

Связанный контент

Дополнительные ресурсы