你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Azure Monitor 监视虚拟机:分析监视数据

本文是指南在 Azure Monitor 中监视虚拟机及其工作负载的一部分。 文中介绍在完成配置后如何分析虚拟机的监视数据。

注意

本方案描述如何实现对 Azure 和混合虚拟机环境的完整监视。 若要开始监视你的第一台 Azure 虚拟机,请参阅监视 Azure 虚拟机教程:从 Azure 虚拟机收集来宾日志和指标

为虚拟机配置数据收集后,就可以使用数据进行分析。 本文介绍 Azure Monitor 的不同功能,你可以使用这些功能来分析虚拟机的运行状况和性能。 其中有些功能可以根据要分析的是单台计算机还是多台计算机来提供不同的体验。 这里通过每项功能的独特行为来介绍每种体验,具体取决于所使用的体验。

单台计算机体验

在每个 Azure 虚拟机和启用 Azure Arc 的服务器上,从 Azure 门户菜单的“监视”部分访问单台计算机分析体验。 这些选项会限制你可以查看的该机算机的数据,或者至少会为此设置一个初始筛选器。 通过这种方式,你可以专注于特定的计算机,查看其当前性能及其在一段时间内的趋势,并帮助确定可能遇到的任何问题。

屏幕截图:显示在 Azure 门户中分析虚拟机。

选项 说明
概述页 选择“监视”选项卡,以显示虚拟机主机的警报、平台指标以及其他监视信息。 可以在选项卡上查看活动警报的数量。在“监视”选项卡中,可以快速查看:

警报:过去 24 小时内触发的警报,以及有关这些警报的一些重要统计信息。 如果没有为此 VM 设置任何警报,有一个链接可帮助你快速为 VM 创建新警报。

关键指标:重要指标在不同时间段的趋势,如 CPU、网络和磁盘。 由于这些是主机指标,因此不包括来宾操作系统中的计数器(如内存)。 选择在指标资源管理器中处理此数据时要使用的图表,你可以在其中执行各种汇总,并添加更多的计数器进行分析。
活动日志 查看为当前虚拟机筛选的活动日志条目。 使用此日志来查看计算机的最近活动,如任何配置更改以及停止和启动时间。
见解 如果为虚拟机启用了虚拟机见解,则显示虚拟机见解视图。

选择“性能”选项卡,以查看在不同时间段内关键性能计数器的趋势。 在虚拟机菜单中打开 VM insights 时,你还会看到一个表,其中包含每个磁盘的详细指标。 有关如何将映射视图用于单台计算机的详细信息,请参阅 VM insights 的图表性能

如果为虚拟机启用了进程和依赖项,请选择“映射”选项卡以查看计算机上正在运行的进程、其他计算机上的依赖项和外部进程。 有关如何将映射视图用于单台计算机的详细信息,请参阅使用 VM insights 的映射功能了解应用程序组件

如果未为虚拟机启用虚拟机见解,则会提供启用虚拟机见解的选项。
警报 查看当前虚拟机的警报。 这些警报仅将计算机用作目标资源,因此可能存在与之关联的其他警报。 若要查看所有资源的警报,可能需要使用 Azure Monitor 菜单中的“警报”选项。 有关详细信息,请参阅使用 Azure Monitor 监视虚拟机:警报
指标 打开指标资源管理器,并将范围设置为该计算机。 此选项与从“概述”页面选择其中一个性能图表时相同,只不过尚未添加指标。
诊断设置 为当前虚拟机启用和配置诊断扩展。 此选项不同于其他 Azure 资源的“诊断设置”选项。 这是已由 Azure Monitor 代理替换的旧版代理程序
顾问建议 查看 Azure 顾问就当前虚拟机所提供的建议。
日志 打开 Log Analytics,并将范围设置为“当前虚拟机”。 你可以从各种现有查询中选择,以便仅针对此计算机深化日志和性能数据。
连接监视器 打开网络观察程序连接监视器,以监视当前虚拟机和其他虚拟机之间的连接。
工作簿 打开工作簿库,其中包含用于单台计算机的虚拟机见解工作簿。 有关为单台计算机设计的 VM insights 工作簿列表,请参阅 VM insights 工作簿

多台计算机体验

在每个 Azure 虚拟机和启用 Azure Arc 的服务器上,从 Azure 门户的“监视”菜单访问多台计算机分析体验。 这将仅包括启用了虚拟机见解的虚拟机。 这些选项提供对所有数据的访问权限,以便你可以选择要进行比较的虚拟机。

屏幕截图:显示在 Azure 门户中分析多台虚拟机。

选项 说明
活动日志 查看为所有资源筛选的活动日志条目。 为虚拟机或虚拟机规模集的某资源类型创建筛选器,以便查看所有计算机的事件。
警报 查看所有资源的警报。 这包括与工作区中所有虚拟机相关的警报。 为虚拟机或虚拟机规模集的某资源类型创建筛选器,以便查看所有计算机的警报。
指标 打开指标资源管理器,并且未选择任何范围。 如果要在多台计算机之间比较趋势,此功能特别有用。 选择订阅或资源组,以快速添加一组要一起分析的计算机。
日志 打开 Log Analytics,并将范围设置为工作区。 你可以从各种现有查询中选择,以便针对所有计算机深化日志和性能数据。 也可以创建自定义查询来执行其他分析。
工作簿 打开工作簿库,其中包含用于多台计算机的虚拟机见解工作簿。 有关为多台计算机设计的 VM insights 工作簿列表,请参阅 VM insights 工作簿

虚拟机见解体验

VM insights 包含多个性能图表,可帮助你快速获取受监视计算机的操作状态、随时间推移的趋势性能以及计算机与进程之间的依赖关系。 此外,还提供任何受监视计算机不同方面的合并视图,如 Log Analytics 工作区中收集的属性和事件。

“开始”选项卡显示 Azure 订阅中的所有计算机,并标识哪些计算机正在被监视。 使用此视图可快速确定哪些计算机不受监视,并将尚未监视的单个计算机加入其中。

屏幕截图:显示 VM insights 启动。

“性能”视图包括多个包含若干关键绩效指标 (KPI) 的图表,有助你确定计算机的运行状况。 这些图表显示一段时间内的资源利用率。 你可以通过这些图表识别瓶颈和异常,或切换到列出每个计算机的透视图,以根据所选指标查看资源利用率。 有关如何使用性能视图的详细信息,请参阅 VM insights 的性能图表

屏幕截图:显示 VM insights 的性能。

使用“映射”视图可以查看计算机上运行的进程及其在其他计算机上的依赖关系,以及外部进程。 你可以更改视图的时间窗口,以确定这些依赖关系是否在一段时间后发生改变。 有关如何使用映射视图的详细信息,请参阅使用 VM insights 的映射功能了解应用程序组件

屏幕截图:显示 VM insights 的映射。

比较指标和日志

对于 Azure Monitor 的许多功能,你无需了解它使用的各类数据及其存储位置。 例如,你可以使用 VM insights,但无需了解要用哪些数据填充性能视图、映射视图和工作簿。 你只需关注要分析的逻辑。 深入探索时,你需要了解 Azure Monitor MetricsAzure Monitor Logs 之间的差异。 Azure Monitor 的不同功能会使用不同种类的数据。 用于特定方案的警报类型取决于是否在特定位置提供该数据。

如果你不熟悉 Azure Monitor,这种程度的详细信息可能会造成混淆。 以下信息可帮助你了解数据类型之间的差异:

  • 所有非数值数据(如事件)都存储在日志中。 指标只能包含固定时间间隔的取样数值数据。
  • 数值数据可以同时存储在指标和日志中,以便使用不同的分析方式,并支持不同类型的警报。
  • Azure Monitor 代理将来宾操作系统的性能数据发送到 Metrics 或 Logs。
  • 虚拟机见解将来宾操作系统的性能数据发送到 Logs。

使用指标资源管理器分析指标数据

使用指标资源管理器,可以绘制图表、直观地关联趋势,并调查指标中的峰值和谷值。 有关如何使用此工具的详细信息,请参阅使用 Azure Monitor 指标资源管理器分析指标

虚拟机使用以下命名空间。

命名空间 说明 要求
虚拟主机 为所有 Azure 虚拟机自动收集的主机指标。 有关详细指标列表,请参见 Microsoft.Compute/virtualMachines 自动收集,无需任何配置。
虚拟机来宾 Windows 计算机上的来宾操作系统和应用程序性能数据。 安装 Azure Monitor 代理和数据收集规则
azure.vm.linux.guestmetrics Linux 计算机上的来宾操作系统和应用程序性能数据。 安装 Azure Monitor 代理和数据收集规则

使用 Log Analytics 分析日志数据

如果想要更深入地了解用于在工作簿中创建视图的数据和虚拟机见解,请使用 Log Analytics 对日志数据执行自定义分析。 你可能想要分析这些数据的不同逻辑和聚合,将 Microsoft Defender for Cloud 和 Microsoft Sentinel 收集的安全数据与自己的运行状况和可用性数据相关联。

无需了解如何编写日志查询也能使用 Log Analytics。 你可以选择多个预构建的查询,这些查询无需修改即可运行,也可以用来自定义查询。 在 Log Analytics 屏幕顶部选择“查询”,并查看“资源类型”为“虚拟机”或“虚拟机规模集”的查询。 有关如何使用这些查询的信息,请参阅在 Azure Monitor Log Analytics 中使用查询。 有关如何使用 Log Analytics 运行查询并处理其结果的教程,请参阅 Log Analytics 教程

屏幕截图:显示虚拟机查询。

从计算机的“Logs”菜单启动 Log Analytics 时,其范围设置为该计算机。 任何查询将仅返回与该计算机关联的记录。 对于返回表中的所有记录的简单查询,请双击左窗格中的表。 处理这些结果或修改查询以进行更复杂的分析。 若要将范围设置为工作区中的所有记录,请更改范围或从“Monitor”菜单中选择“Logs”。

屏幕截图:显示表格查询。

通过工作簿实现数据可视化

工作簿在 Azure 门户中提供交互式报表,并将不同类型的数据合并到一个视图中。 工作簿可将文本、日志查询、指标和参数合并到丰富的交互式报告中。 有权访问相同 Azure 资源的其他团队成员都可编辑工作簿。

在如下所述的场景中,工作簿非常有用:

  • 在未提前了解相关指标(例如 CPU 利用率、磁盘空间、内存和网络依赖项)的情况下探索虚拟机的使用情况。 与其他使用情况分析工具不同,工作簿可以结合多个类型的可视化效果和分析,非常适合这种自由探索。
  • 通过显示关键计数器的指标和其他日志事件,向团队解释最近预配的 VM 的性能如何。
  • 与团队的其他成员分享调整 VM 试验规模的结果。 你可以用文本解释试验的目标, 然后显示用于评估试验的每个使用情况指标和分析查询,并提供清晰的标注,说明每个指标是高于还是低于目标。
  • 结合数据、文本说明和后续步骤讨论,报告故障对 VM 使用的影响,从而防止未来发生故障。

VM insights 包含以下工作簿。 你可以使用这些工作簿,也可以由此开始创建自定义工作簿,以满足自己的特定要求。

单个虚拟机

工作簿 说明
性能 提供可自定义的性能视图,并在视图中使用所有已启用的 Log Analytics 性能计数器。
连接 提供关于 VM 的入站和出站连接的深入视图。

多台虚拟机

工作簿 说明
性能 在单个工作簿中提供可自定义的“前 N 项列表”和“图表”视图,并在视图中使用所有已启用的 Log Analytics 性能计数器。
性能计数器 提供基于众多性能计数器集的“前 N 项图表”视图。
连接 提供关于受监视计算机的入站和出站连接的深入视图。
活动端口 提供已绑定到受监视计算机上端口的进程列表,及其在所选时间范围内的活动。
打开端口 提供受监视计算机上打开的端口数,以及这些打开端口的详细信息。
失败的连接数 显示受监视计算机上的失败连接计数、失败趋势,以及失败百分比是否不断增大。
安全和审核 提供 TCP/IP 流量分析,其中报告连接总数、恶意连接数,以及 IP 终结点的全球位置。 若要启用所有功能,需要启用“安全性检测”。
TCP 流量 提供受监视计算机的排名报告,在网格中以趋势线的形式显示它们已发送、接收的网络流量和总网络流量。
流量比较 比较一台计算机或一组计算机的网络流量趋势。
AMA 迁移帮助程序 帮助你发现要迁移的内容,并在从 Log Analytics 代理迁移到 Azure Monitor 代理的过程中跟踪进度。 与其他工作簿不同,此工作簿不可从 VM insights 获取。 在 Azure Monitor 菜单上,转到“工作簿”,然后选择“公共模板”。 请参阅用于从 Log Analytics 代理迁移到 Azure Monitor 代理的工具

有关如何创建自定义工作簿的说明,请参阅使用工作簿创建交互式报表 VM insights

屏幕截图:显示虚拟机的工作簿。

后续步骤