了解功能

适用于:Windows Server 2022、Windows Server 2019

本主题定义系统见解中的功能概念,并介绍 Windows Server 2019 中提供的默认功能。

本主题还将介绍用于默认功能的数据源、预测时间线和预测状态。

功能概述

系统见解功能是一种机器学习或统计模型,用于分析系统数据以帮助你更深入地了解部署的运行情况。 系统见解引入了一组初始默认功能,它允许你动态添加新功能,而无需更新操作系统。

注意

此处提供了有关如何创建、添加和更新功能的详细文档,管理功能文档提供了有关此功能的更多概要信息。

此外,每个功能在 Windows Server 实例本地运行,可以单独管理每个功能。

功能输出

调用某个功能时,会提供输出以帮助解释该功能的分析或预测结果。 每个输出必须包含“状态”和用于描述预测的“状态说明”,每个结果可以选择性地包含与预测关联的、特定于功能的数据。 “状态说明”有助于为“状态”提供上下文解释,功能将报告“正常”、“警告”或“严重”状态。 此外,如果未做出预测,则功能可以使用“错误”或“无”状态。 下面是功能状态及其基本含义:

  • 正常 - 一切看起来正常
  • 警告 - 无需立即关注,但应该检查一下
  • 严重 - 应该尽快检查
  • 错误 - 未知问题导致功能失败
  • 无 - 未做出预测。 这可能是因为缺少数据,或任何其他特定于功能的原因导致未做出预测。

此外,结果中包含的任何特定于功能的数据都将放入用户可访问的 JSON 文件中,可以使用 PowerShell 查找文件路径。

默认功能

在 Windows Server 2019 中,系统见解引入了四个专注于容量预测的默认功能:

  • CPU 容量预测 - 预测 CPU 使用率
  • 网络容量预测 - 预测每个网络适配器的网络使用量
  • 存储消耗总量预测 - 预测所有本地驱动器的存储消耗总量
  • 卷消耗量预测 - 预测每个卷的存储消耗量

每个功能将分析以往历史数据以预测将来的使用量,所有预测功能用于预测长期趋势而不是短期行为,可帮助管理员正确预配硬件并优化其工作负载,以避免将来发生资源争用。 因为这些功能侧重于长期使用量,因此它们将分析日常数据。

预测模型

默认功能使用预测模型来预测将来的使用量,对于每个预测,将在本地基于计算机的数据训练模型。 该模型旨在帮助检测长期趋势,在每个 Windows Server 实例上重新训练使功能可以适应特定的行为和每台计算机使用量的细微差别。

注意

若要确定使用哪种类型的模型,需要使用包含数万个计算机的数据集测试许多模型。 在分析和调整这些模型后,我们决定使用自动回归预测模型,因为它可以生成高度准确且视觉上直观的预测结果,同时不需要太多的训练时间。 但是,此模型需要三周的训练数据,因此在有三周的数据可用之前,每个功能将使用基本线性趋势。

预测时间线

默认功能根据已收集数据的天数预测将来的特定天数。 下表显示了这些功能的预测时间线:

输入数据大小 预测时长
0-5 天 未做出预测。
6-180 天 1/3 * 输入数据大小
180-365 天 60 天

预测数据

每个功能分析每日数据以预测将来的使用量。 但是,CPU、网络甚至存储使用量在一天中可能频繁变化,从而会根据计算机上的工作负载动态调整。 由于一天中的使用量并不恒定,在单个数据点中正确表示每日使用量非常重要。 下表详细说明了特定的数据点以及数据的处理方式:

功能名称 数据源 筛选逻辑
卷消耗预测 Volume size 最大每日使用量
总存储消耗预测 卷大小之和,磁盘大小之和 最大每日使用量
CPU 容量预测 处理器时间百分比 每日最多 2 小时的平均值
网络容量预测 字节总数/秒 每日最多 2 小时的平均值

在评估上述筛选逻辑时请务必注意,每个功能会试图在将来使用量明显超过可用容量时通知管理员 – 即使 CPU 暂时达到 100% 利用率,CPU 使用率也可能不会导致明显的性能下降或资源争用。 那么,对于 CPU 和网络,应该会持续出现较高的使用率而不是瞬间高峰。 但是,计算全天 CPU 和网络使用量的平均值会丢失重要的使用量信息,因为几个小时的较高 CPU 或网络使用量就可能会明显影响关键工作负载的性能。 计算每日最多 2 小时的平均值可以避免这些极端情况,并且仍可为每个要分析的功能生成有意义的数据。

但是,对于卷和总存储使用量,存储使用量不能超过可用容量(即使是暂时性的),因此最大每日使用量用于这些功能。

预测状态

所有系统见解功能都必须输出与每个预测关联的状态。 每个默认功能使用以下逻辑来定义每种预测状态:

  • 正常:预测未超过可用容量
  • 警告:预测在将来 30 天内会超过可用容量
  • 严重:预测在将来 7 天内会超过可用容量
  • 错误:功能遇到意外错误
  • 无:没有足够的数据用于做出预测。 这可能是因为缺少数据或最近未报告任何数据。

注意

如果功能在多个实例(例如多个卷或网络适配器)上预测,则状态将反映所有实例中最严重的状态。 每个卷或网络适配器的各种状态显示在 Windows Admin Center 中,或显示在每个功能的输出中包含的数据中。 有关如何分析默认功能的 JSON 输出的说明,请访问此博客

其他参考

若要详细了解系统见解,请使用以下资源: