В этой статье объясняется, как спланировать, настроить и оптимизировать мониторинг в Azure при интеграции данных из других облаков, локальных и пограничных сред. Мониторинг облачных ресурсов Azure включает непрерывное наблюдение и анализ производительности, работоспособности и безопасности облачных ресурсов и приложений. Строгая стратегия мониторинга включает в себя упреждающий мониторинг для перехвата проблем раннего и реактивного мониторинга для активации оповещений и автоматизации ответов при возникновении непредвиденных событий.
Общие сведения о области мониторинга
Область мониторинга определяет обязанности по мониторингу. В облачной среде вы разделяете обязанности по мониторингу, которые отличаются по рабочей нагрузке. Осознайте свои обязанности по мониторингу, чтобы обеспечить покрытие всех областей мониторинга для каждой рабочей нагрузки. В следующей таблице показано, что необходимо отслеживать на основе каждого типа рабочей нагрузки. Службы инфраструктуры (IaaS) и службы платформы (PaaS) работают в облачной среде, такой как Azure. Службы программного обеспечения (SaaS) относятся к таким решениям, как Microsoft 365.
Области мониторинга
Локальный мониторинг
Мониторинг IaaS
Мониторинг PaaS
Мониторинг SaaS
Работоспособность службы
X
X
X
X
Безопасность
X
X
X
X
Согласие
X
X
X
X
Стоимость
X
X
X
X
Данные
X
X
X
X
Код и среда выполнения
X
X
X
Облачные ресурсы
X
X
X
Операционная система
X
X
Уровень виртуализации
X
X
Физическое оборудование
X
Планирование стратегии мониторинга
Стратегия мониторинга описывает ваши требования к надзору в каждой среде. Вам нужен четкий план для объединения видимости и поддержки операционной зрелости. Необходимо обнаруживать, диагностировать и предотвращать проблемы с помощью комплексного анализа всей системы. Вот как:
Установите план мониторинга. Создайте план, который охватывает три прогрессивных уровня операционной зрелости: обнаружение и устранение проблем в режиме реального времени, диагностика текущих или прошлых проблем, а также прогнозирование и предотвращение будущих проблем. В этом плане объясняется, как следует увеличивать возможности мониторинга, чтобы вы могли определять приоритеты улучшений, эффективно выделять ресурсы и поддерживать согласованную надежность.
определите, что необходимо отслеживать. тщательно провести инвентаризацию всей среды, включая Azure, другие облака, пограничные развертывания и локальные системы. Используйте Azure Resource Graph Explorer для поиска всех ресурсов Azure. Начните с примера запросов для сбора базового списка ресурсов. Этот комплексный подход помогает выявить пробелы в охвате и обеспечить сбор критически важных данных из всех соответствующих источников. Используйте Azure Arc для переноса данных мониторинга из локальной среды, других облаков или пограничных расположений в Azure.
Определите целевые показатели надежности. Установите целевые показатели уровня обслуживания (SLOs), индикаторы уровня обслуживания (SLIs) и бюджеты ошибок для каждой рабочей нагрузки. Включите нефункциональные требования, такие как цель времени восстановления (RTO) и цель точки восстановления (RPO). Четкие целевые показатели обеспечивают контрольные показатели для измерения успешного выполнения операций и руководства по улучшению.
Определение требований к сбору данных. определите, какие метрики и журналы необходимо собирать для диагностики соответствия, безопасности и эффективной диагностики проблем. Начните с требований соответствия нормативным требованиям, а затем соблюдайте внутренние правила управления. Сбор правильных данных помогает эффективно выполнять аудит, поддерживать безопасность и обеспечивать оптимальную работу систем. Если вы не знаете, что собирать, соберите все доступные журналы и метрики, чтобы избежать пробелов данных и оптимизации затрат. Смотрите ссылки на полный список документации по мониторингу Azure для каждой службы Azure.
определите требования к хранению данных. Определите, сколько времени необходимо хранить данные мониторинга в соответствии с потребностями аудита и соответствия требованиям. Соблюдают внутренние политики управления для хранения журналов в течение необходимого времени. Правильные политики хранения позволяют анализировать исторические данные, поддерживать соответствие нормативным требованиям и сохранять данные для расследований безопасности.
определение требований к оповещению. Определите, какие критические события должны активировать оповещения, такие как сбои ресурсов, нарушения пороговых значений производительности или аномалии безопасности. Классификация оповещений по серьезности, структура действий реагирования и указание путей эскалации, чтобы срочные события достигли нужных команд. Используйте оповещения Azure Monitor для настройки правил генерации оповещений, уведомлений и групп действий. Упреждающие оповещения обеспечивают быстрые ответы и сокращают время простоя.
назначить обязанности по мониторингу. У вас есть две основные обязанности: мониторинг всего облачного пространства и мониторинг каждой рабочей нагрузки. Определите требования к базовому мониторингу, укажите данные, которые необходимо записать, и указать, кто владеет каждой задачей мониторинга. Эти шаги помогут вам избежать проблем, оптимизировать усилия по реагированию и обеспечить согласованные методики в организации.
протестировать и уточнить подход к мониторингу. Убедитесь, что вы записываете правильные данные и активируете оповещения по правильным пороговым значениям. Настройте целевые показатели сбора и надежности данных на основе новых результатов. Итеративные улучшения помогают адаптироваться к изменению бизнес-потребностей, мониторингу пробелов и поддержанию оптимальной производительности системы.
Разработка решения для мониторинга
Проектирование решения мониторинга относится к созданию системы для сбора и хранения журналов, метрик и аналитических сведений. Хорошо разработанное решение помогает удовлетворить потребности в работе, безопасности и соответствия требованиям. Вот как:
Объедините ваши решения для мониторинга. Используйте одну платформу для мониторинга локальных, облачных, публичных облаков и периметральных сред. Этот консолидированный подход упрощает операции, предотвращает частое переключение инструментов и позволяет команде быстро обнаруживать и устранять проблемы. Начните с Azure Monitor в качестве основного решения для мониторинга. Используйте Azure Arc для сбора данных из других облаков, локальных и пограничных развертываний. Используйте доступные средства мониторинга Azure и отправьте их данные в Azure Monitor для централизованной видимости.
Цель централизовать данные мониторинга. предпочитать меньше расположений для хранения журналов и метрик. Меньше расположений упрощает управление данными и их сопоставление. Существует несколько причин для хранения и анализа данных мониторинга в нескольких местах. Например, операции безопасности, расположение данных, устойчивость данных и количество клиентов Azure являются всеми факторами, которые могут потребовать хранения данных мониторинга в нескольких расположениях. Дополнительные сведения см. в статье Проектирование архитектуры рабочей области Log Analytics.
Понять, куда отправлять данные мониторинга. Собирать журналы и метрики и хранить их в местах назначения, которые соответствуют вашим операционным потребностям. Выберите из этих основных назначений Azure: рабочая область Azure Log Analytics (интерактивное и долгосрочное хранилище), учетная запись хранения Azure (долгосрочное хранилище), Центры событий Azure (интеграция SIEM сторонних производителей), Azure Data Explorerи партнерское решение. При наличии общедоступности используйте правила сбора данных и для настройки централизованного сбора данных мониторинга. В противном случае используйте параметры диагностики .
Автоматизация мониторинга. Вы хотите автоматически применять политики мониторинга в более крупных средах.
Используйте политику Azure. Управляйте сбором и местом назначения данных с помощью политики Azure. Вы можете начать с встроенных политик мониторинга для применения настроек диагностики. При необходимости можно создавать пользовательские политики. Вы также можете использовать политику Azure для управления правилами сбора данных и установить агент Azure Monitor на виртуальных машинах. Используйте политику Azure для определения базового уровня оповещений Azure Monitor в посадочной зоне Azure.
Используйте инфраструктуру в качестве кода (IaC). Используйте инфраструктуру в качестве кода для настройки и развертывания ресурсов Azure Monitor в масштабе. Этот метод — это профессиональный способ управления ресурсами.
Оптимизация расходов на мониторинг. Сначала оцените стоимость решения мониторинга. Если у вас достаточно данных, используйте калькулятор цен Azure , чтобы оценить стоимость коллекции в долгосрочной перспективе и настроить параметры сбора в соответствии с бюджетом. Со временем регулярно просматривайте данные мониторинга, которые вы собираете и храните. То, что вы собираете, где храните его, и сколько времени вы храните, влияет на стоимость. Настройте периоды хранения, чтобы оптимизировать затраты без остановки сбора определенных данных мониторинга. Чтобы оптимизировать затраты, остановите сбор ненужных журналов. Для получения дополнительных советов по оптимизации затрат см. раздел "Оптимизация затрат в Azure Monitor".
Настройка мониторинга
Настройка мониторинга включает настройку средств и параметров для сбора аналитических сведений в среде Azure. Правильная конфигурация обеспечивает упреждающее обнаружение проблем и согласование с предписывающим управлением в вашей облачной среде. Вот как:
Мониторинг работоспособности службы
Доступность службы мониторинга сосредоточена на обнаружении сбоев служб, сбоев и проблем с ресурсами в облачной среде. Требуется видимость потенциальных проблем в режиме реального времени для поддержания согласованных операций. Мониторинг работоспособности службы — это минимально необходимый мониторинг вашего облачного хозяйства. Вот как:
Отслеживать работоспособности базовой службы. необходимо учитывать все базовые сбои в облачных службах и регионах, которые вы используете. Используйте azure Service Healthдля получения бесплатных оповещений о проблемах службы, плановом обслуживании и других изменениях, влияющих на службы и регионы Azure.
Отслеживать работоспособности базовых ресурсов. Вам нужен способ диагностики и устранения базовых проблем в облачных ресурсах. Вам также нужна история этих сбоев, чтобы сообщить о любых нарушениях соглашения об уровне обслуживания (SLA). Используйте azure Resource Healthдля мониторинга работоспособности отдельных облачных ресурсов.
Мониторинг безопасности
Мониторинг безопасности включает отслеживание взаимодействий идентификаций, уязвимостей и сетевой активности для защиты вашей инфраструктуры Azure. Вам нужен непрерывный мониторинг безопасности для защиты данных и обеспечения соответствия требованиям в облачных средах. Вот как:
Мониторинг идентификации. Необходимо понимать взаимодействие с пользователями, обнаруживать потенциально рискованные попытки входа, устранять проблемы со входом и проверять изменения идентификационных данных, чтобы обеспечить безопасность и работоспособность вашей среды. Настройте мониторинг Microsoft Entra и соберите журналы, которые вам необходимы для выполнения требований безопасности и соответствия.
Отслеживайте уязвимости системы безопасности. Требуется одно решение для мониторинга безопасности для обнаружения уязвимостей безопасности в различных средах. Например, используйте Microsoft Defender для облака для мониторинга уязвимостей безопасности в Azure, других общедоступных облаках, пограничных устройствах и локальных частных сетях. Используйте Microsoft Sentinel для сведений о безопасности и даже управления (SIEM) и оркестрации безопасности, автоматизации и реагирования (SOAR). Microsoft Sentinel использует платформу Log Analytics, поэтому у вас есть некоторые ключевые симбиозы.
Отслеживать сетевое действие. необходимо отслеживать сетевой трафик в облаке и сетях за пределами облака. Мониторинг сети помогает устранять проблемы с производительностью и поддерживать сетевую безопасность. Используйте Network Watcher для мониторинга виртуальных сетей Azure (с помощью журналов потоков и анализа трафика ). Используйте монитор подключения для многооблачного и локального мониторинга сети.
Мониторинг соответствия проверяет соответствие требованиям к управлению и отраслевым нормативным требованиям. Необходимо отслеживать соответствие требованиям, чтобы снизить риски и следовать предписывающим стандартам для хорошо управляемого ресурса Azure. Вот как:
контроль соответствия конфигурации. Вам нужны способы согласования сред с вашими политиками управления. Используйте Azure Policy для автоматического аудита и приведения в действие определённых политик. Он также отслеживает соответствие этим политикам. Политика Azure является бесплатной и предлагает встроенные политики, которые соответствуют многим нормативным стандартам, таким как ISO 270001, NIST SP 800-53, PCI DSS, а также Общего регламента по защите данных ЕС (GDPR).
Мониторинг соответствия данным. Необходимо автоматически оценивать соответствие требованиям и управлять ими в среде с несколькими облаками, упрощая соответствие требованиям и уменьшая риск. Используйте Microsoft Purview Compliance Manager для оценки соответствия требованиям и управления ими в многооблачных средах.
Затраты на мониторинг относятся к отслеживанию и управлению облачными расходами в Azure и других средах. Требуется прозрачность затрат, чтобы оптимизировать использование ресурсов и следовать указаниям по управлению финансами. Вот как:
Общие сведения о ценах на услуги. Убедитесь, что вы понимаете цены на службы и функции, которые вы используете. Вы хотите избежать сюрпризов в период выставления счетов. Используйте сведения о ценах Azure.
Мониторинг расходов на облако. Следует использовать доступные средства для мониторинга затрат в разных средах. Для расходов Azure используйте службу "Управление затратами Azure" для задания бюджетов, получения рекомендаций по оптимизации затрат, активации оповещений для аномалий затрат и анализа затрат.
Регулярно проводите обзор облачных расходов. Включайте проверки затрат в вашу регулярную рабочую практику. Регулярные оценки позволяют своевременно выявлять шаблоны расходов и настраивать использование ресурсов для оптимизации затрат.
Мониторинг данных означает надзор за управлением данными, защитой и использованием в azure, локальной среде, мультиоблачной среде и SaaS. Вам нужна видимость и безопасность данных для обеспечения соответствия требованиям и сохранения непрерывности бизнес-процессов в вашем активе Azure. Вот как.
Отслеживать корпоративные данные. вам нужен способ управления и защиты бизнес-данных во всех средах. Используйте Microsoft Purview для обеспечения видимости данных, безопасности и соответствия требованиям в этих средах.
На уровне рабочей нагрузки необходимо собрать данные телеметрии (журналы приложений, метрики и трассировки) в коде и процессе выполнения приложения, чтобы определить проблемы и оптимизировать производительность. Данные о поведении приложений в режиме реального времени обеспечивают целевую диагностику и устранение неполадок, а также оптимизацию.
Для рабочих нагрузок в Azure используйте Application Insights для сбора данных телеметрии среды выполнения (инструментирования), чтобы определить узкие места производительности и ошибки. Application Insights позволяет отслеживать динамические веб-приложения, обнаруживать аномалии производительности и получать аналитические сведения о взаимодействии пользователей, помогая постоянно повысить производительность и удобство использования. Сведения о коде для конкретной рабочей нагрузки и руководстве по мониторингу см. в Well-Architected Framework:
Мониторинг облачных ресурсов охватывает наблюдение за действиями уровня управления, журналами ресурсов и метриками производительности в Azure. Необходимо подробное представление об использовании ресурсов и изменениях для обеспечения безопасности, соответствия требованиям и эффективности работы. Вот как:
Мониторинг действий уровня управления. вам нужно знать, кто создал, обновил и удалил ресурсы в облачной среде. В Azure необходимо отслеживать действия уровня управления во всех ваших подписках. Azure автоматически фиксирует события уровня управления для каждой подписки, которые называются журналами активности Azure.
создание параметра диагностики для отправки этих журналов действий в нужное место назначения
Сбор журналов облачных ресурсов. необходимо собирать данные журнала для каждого облачного ресурса, чтобы эффективно оценить работоспособность и устранить неполадки. Разные службы имеют разные типы журналов. В Azure необходимо настроить журналы ресурсов Azure для каждой службы для их сбора. Если вы не знаете, что собирать, соберите все доступные журналы и метрики, чтобы избежать пробелов данных и оптимизировать затраты позже. Чтобы оптимизировать затраты, настройте период хранения и исключите определенные журналы из коллекции, если это не нужно. Собранные журналы и срок их хранения должны сбалансировать затраты на соответствие, безопасность и непрерывность бизнес-процессов (анализ первопричин). Дополнительные сведения см. в рекомендациях по оптимизации затрат Azure Monitor
Сбор метрик ресурсов. Вам нужна видимость работоспособности и производительности облачных ресурсов. Чтобы получить данные на конкретный момент времени для устранения неполадок, требуются данные временных рядов. В Azure каждая служба автоматически создает метрики Azure Monitor. Анализируйте эти метрики в обозревателе метрик и настройте правила оповещений для них. Проверьте период хранения по умолчанию для метрик Azure Monitor. Если необходимо сохранить метрики в течение длительного периода, создайте параметр диагностики для хранения в рабочей области Log Analytics для анализа и корреляции с данными журнала. Там, где это возможно, используйте правила сбора данных для настройки централизованного мониторинга сбора данных.
Мониторинг ресурсов рабочей нагрузки. Руководство по мониторингу облачных ресурсов для конкретной рабочей нагрузки см. в Well-Architected Framework:
Настройка оповещений означает настройку уведомлений на основе пороговых значений производительности или условий работы. Вам нужны своевременные оповещения, чтобы быстро реагировать и следовать указаниям по управлению инцидентами. Вот как:
упреждающее определение проблем со работоспособностью. необходимо определить пороговые значения ключевых показателей производительности для мониторинга работоспособности ресурсов. Этот упреждающий подход обеспечивает своевременное обнаружение потенциальных проблем и обеспечивает быстрое исправление. Используйте оповещения Azure Monitor . Если вы не уверены в пороговых значениях, которые следует использовать в оповещениях, создайте оповещение метрик с динамическими пороговыми значениями. Используйте базовые оповещения Azure Monitor в качестве отправной точки.
Определите серьезность оповещения. Есть система, чтобы классифицировать серьезность каждого оповещения. Примените более высокий уровень серьезности к ресурсам, которые критически важны для бизнес-операций, таких как общие службы и бизнес-рабочие нагрузки. Используйте более низкую степень серьезности для других ресурсов.
уведомить заинтересованных лиц. Определите, кто должен получать уведомление при активации оповещения. Децентрализованный подход направляет соответствующие оповещения правильным людям. Начните с гибкого метода, который оповещает заинтересованных лиц, когда ресурс приближается к аномальному поведению. Настройте по крайней мере одну группу действий для каждой подписки. Такой подход обеспечивает получение соответствующим персоналом оповещений. Включите канал уведомлений электронной почты в качестве минимального требования. Уведомлять группы операций о оповещениях с более низкой степенью серьезности и уведомлять управление о оповещениях высокого уровня серьезности. Дополнительные сведения см. в настройке оповещений с помощью Azure Logic Apps и интеграции с продуктом управления ИТ-службами (ITSM) .
Выберите каналы уведомлений. эффективные стратегии уведомлений повышают время отклика и устраняют потенциальные последствия. При необходимости используйте уведомление электронной почты в качестве базового плана и добавьте SMS или интегрируйте с системами управления инцидентами.
Визуализация данных мониторинга
Визуализация данных мониторинга относится к созданию панелей мониторинга и отчетов, которые представляют критически важные метрики в доступном формате. Четкая визуализация поддерживает принятие обоснованных решений и соответствует регламентированным подходам к управлению вашими ресурсами Azure. Вот как:
Разработка панелей мониторинга. Использовать книги Azure Monitor и создавать панели мониторинга портала Azure. Панели мониторинга представляют краткие аналитические сведения. Электронные таблицы позволяют углубленно изучать данные с помощью пользовательских запросов и исследований. Используйте панели мониторинга для общих обзоров. Используйте книги для подробного устранения неполадок или расширенного мониторинга. Если вы используете Grafana, используйте Managed Grafana.
Адаптируйте визуализации. Настраивайте диаграммы и отчеты для разных аудиторий, будь то сегментированные по командам (предприятиям) или по общему влиянию на бизнес (стартапы).
Средства мониторинга Azure
Ниже приведена таблица всех служб и средств Azure, на которые ссылается эта статья.
Служит центральной платформой, которая собирает данные телеметрии из облачных и локальных сред. Он отслеживает производительность ресурсов и рабочее состояние.
Предоставляет состояние в режиме реального времени и персонализированную информацию о проблемах службы, плановом обслуживании и других изменениях, влияющих на службы и регионы Azure.
Узнайте о возможностях отслеживания серверов с поддержкой Azure Arc. Изучите преимущества подключения серверов с поддержкой Azure Arc к журналам и метрикам Azure, аналитике виртуальных машин и оповещениям Azure Monitor.