什么是 Azure Stack HCI 监视?
适用于:Azure Stack HCI 版本 23H2
本文概述了 Azure Stack HCI 监视。
监视 Azure Stack HCI 涉及从系统的所有组件定期收集和分析数据,以及时识别和解决任何潜在问题。 日常监视对于维护 Azure Stack HCI 系统的运行状况和功能至关重要。
若要了解当前性能模式、识别性能异常并开发解决问题的方法,请务必为系统设置不同时间和负载条件下的基线性能指标。
Azure Stack HCI 利用 Azure Monitor 工具,例如见解、指标、日志、工作簿和警报。 这些工具有助于收集数据、分析和主动响应已建立基线的一致或趋势差异。
体系结构概况
从广义上看,Azure Stack HCI 监视的体系结构包括以下关键组件:
- 部署扩展以收集日志、指标、遥测和警报。
- 使用 Azure Monitor 工具(如见解、指标、日志、工作簿和警报)有效地分析、可视化和响应数据。
下图是 Azure Stack HCI 监视实现的体系结构表示形式。
Azure Stack HCI 中的监视功能
本部分介绍 Azure Stack HCI 中的监视功能。
洞察力
见解是 Azure Monitor 的一项功能,可让你快速开始使用日志监视 Azure Stack HCI 群集。 可以使用见解同时监视单个 Azure Stack HCI 群集或多个群集。 适用于 Azure Stack HCI 的见解使用 Azure Monitor 代理以日志形式收集数据,然后将数据存储在 Log Analytics 工作区中。 它使用 Kusto 查询语言 (KQL) 查询 Log Analytics 工作区,并使用 Azure 工作簿可视化结果。 若要了解如何使用见解监视单个或多个群集,请参阅 使用见解监视单个群集 或使用 见解监视多个群集。
使用 Insights for Azure Stack HCI,可以访问具有基本指标的默认工作簿,以及为监视 Azure Stack HCI 的关键功能而创建的专用工作簿。 若要了解有关这些功能工作簿的详细信息,请参阅 使用 Insights 监视 HCI 功能。
指标
使用 Azure Stack HCI 可将群集中的数字数据存储在专用时序数据库中。 此数据使用遥测和诊断 Arc 扩展收集,然后使用指标资源管理器进行分析。 若要详细了解指标,请参阅 使用 Azure Monitor 指标监视 Azure Stack HCI。
警报
在监视数据中发现重要情况时,警报会以主动的方式通知你。 有了警报,你就可以在系统的用户注意到问题之前确定和解决这些问题。 响应可以是发送给管理员的文本或电子邮件,也可以是尝试更正错误状态的自动化过程。 可以针对从 Azure Stack HCI 系统收集的任何指标或日志数据发出警报。
有关警报的详细信息,请参阅 什么是 Azure Monitor 警报?
警报类型
下表提供了 Azure Stack HCI 中每种警报类型的简要说明和设置说明:
警报类型 | 描述 | 配置方式 |
---|---|---|
运行状况警报 | 这些警报是系统生成的警报,无需额外付费。 无需设置 Log Analytics 或手动创建任何警报规则。 | 请参阅 为 Azure Stack HCI 配置运行状况警报。 |
基于日志的警报 | 这些是客户定义的警报,用于对日志数据执行高级逻辑操作。 这些警报允许使用 Log Analytics 查询以预定义的频率评估资源日志。 | 请参阅 为 Azure Stack HCI 设置日志警报。 |
基于指标的警报 | 这些是客户定义的警报,用于定期评估 Azure Stack HCI 系统的指标。 如果希望收到有关需要很少或不需要操作的数据的警报,指标警报很有用。 | 请参阅 为 Azure Stack HCI 设置指标警报。 |
建议的警报 | 这些是 Azure Stack HCI 群集资源的预定义的基于指标的警报。 这些警报提供对一组常见指标(包括 CPU 百分比和可用内存)的初始监视。 | 请参阅 为 Azure Stack HCI 启用建议的警报规则。 |