Поделиться через


Анализ и визуализация событий с помощью журналов Azure Monitor

Azure Monitor собирает и анализирует данные телеметрии от приложений и служб, размещенных в облаке, и предоставляет средства анализа, с помощью которых вы сможете максимально увеличить их доступность и производительность. В этой статье описано, как выполнять запросы к журналам Azure Monitor для получения полезных сведений и устранения неполадок, которые могут возникнуть в кластере. Рассматриваются следующие распространенные вопросы:

  • Как диагностировать проблемы с событиями работоспособности?
  • Как узнать, когда узел перестал работать?
  • Как узнать, запущены или остановлены ли службы приложения?

Дополнительные сведения об использовании Azure Monitor для сбора и анализа данных для этой службы см. в статье "Мониторинг Azure Service Fabric".

Получите доступ к решению "Аналитика Service Fabric"

В портал Azure перейдите в группу ресурсов, в которой вы создали решение Service Fabric Analytics.

Выберите ресурс ServiceFabric<имя рабочей области OMS>.

В Summary вы увидите плитки в форме графа для каждого включенного решения, включая одну для Service Fabric. Выберите график Service Fabric, чтобы продолжить работу с решением Service Fabric Analytics.

Решение Service Fabric

На следующем изображении показана домашняя страница решения "Service Fabric Analytics". На этой домашней странице представлена информация, касающаяся работы вашего кластера.

Снимок экрана: домашняя страница решения Аналитики Service Fabric.

Если включить диагностику во время создания кластера, можно просмотреть такие события:

Примечание.

Помимо готовых событий Service Fabric, можно собирать дополнительные системные события. Для этого обновите файл конфигурации расширения диагностики.

Просмотр событий Service Fabric, включая действия на узлах

На странице "Аналитика Service Fabric" выберите график для событий Service Fabric.

Операционный канал решения Service Fabric

Выберите список , чтобы просмотреть события в списке. После этого вы увидите все собранные системные события. Эти данные взяты из таблицы WADServiceFabricSystemEventsTable в учетной записи хранилища Azure, а события надежных служб и актеров, которые указаны далее, также взяты из соответствующих таблиц.

Операционный канал запроса

Или вы можете выбрать лупу слева и использовать язык запросов Kusto, чтобы найти то, что вам нужно. Например, чтобы найти все действия, выполняемые в узлах кластера, можно использовать приведенный ниже запрос. Идентификаторы событий, используемые ниже, можно найти в справочнике по событиям операционного канала.

ServiceFabricOperationalEvent
| where EventId < 25627 and EventId > 25619 

Вы можете запрашивать много дополнительных полей (например, конкретные узлы (Компьютер) и системную службу (TaskName)).

Просмотр событий Reliable Services и Reliable Actors в Service Fabric

На странице "Аналитика Service Fabric" выберите график для Reliable Services.

Надежные службы в решении Service Fabric

Выберите список , чтобы просмотреть события в списке. Здесь можно просмотреть события из служб Reliable Services. Когда служба RunAsync запускается и завершается, могут отображаться различные события. Обычно это происходит при развертывании и обновлении.

Запрос к Надежным Услугам

Аналогичным образом можно просмотреть события надёжных актёров. Чтобы настроить более детализированные события для надежных акторов, необходимо изменить scheduledTransferKeywordFilter в конфигурации диагностического расширения (см. ниже). Сведения об этих значениях находятся в справочнике по событиям Reliable Actors.

"EtwEventSourceProviderConfiguration": [
                {
                    "provider": "Microsoft-ServiceFabric-Actors",
                    "scheduledTransferKeywordFilter": "1",
                    "scheduledTransferPeriod": "PT5M",
                    "DefaultEvents": {
                    "eventDestination": "ServiceFabricReliableActorEventTable"
                    }
                },

Язык запросов Kusto предоставляет широкие возможности. Вы можете выполнить другой полезный запрос, чтобы узнать, какие узлы создают больше событий. На следующем снимке экрана показаны операционные события Service Fabric, агрегированные с данными о конкретной службе и узле.

События запросов на каждом узле

Дальнейшие действия