硬件错误和错误源

硬件错误是计算机系统中硬件组件的故障。 硬件组件包含错误检测机制,可在存在硬件错误条件时进行检测。 硬件错误可以归类为 已更正错误未更正的错误

  • 更正错误是硬件错误条件,在操作系统收到有关存在错误条件的通知时,硬件或固件已更正。

  • 未更正错误是硬件或固件无法更正的硬件错误条件。 未更正的错误分为 致命非致命错误。

    • 致命硬件错误是硬件确定为不可恢复的未更正或未控制的错误条件。 发生致命的未更正错误时,操作系统会生成一个 bug 检查以包含该错误。
    • 非严重硬件错误是一种未更正的错误条件,操作系统可以通过尝试更正错误来尝试恢复。 如果操作系统无法更正错误,它将生成一个 bug 检查以包含该错误。

硬件 错误源 的概念是 Windows 硬件错误体系结构 (WHEA) 的基本概念。 硬件错误源是提醒操作系统存在错误条件的任何硬件单元。 硬件错误源的示例包括:

  • 处理器计算机检查异常 (,例如 MC#)

  • 芯片集错误信号 (,例如 SCI、SMI、SERR#、MCERR#)

  • I/O 总线错误报告 (例如 PCI Express 根端口错误中断)

  • I/O 设备错误

单个硬件错误源可能会处理多种类型的硬件错误条件的错误报告。 例如,处理器的计算机检查异常通常报告处理器错误、缓存和内存错误以及系统总线错误。

注意 SMI) (系统管理中断由固件处理,而不是由操作系统处理。

硬件错误源通常由以下内容表示:

  • 一个或多个硬件错误状态寄存器

  • 一个或多个硬件错误配置或控制寄存器

  • 用于提醒操作系统存在硬件错误条件的信号机制

在某些情况下,没有显式信号机制,操作系统必须轮询错误状态寄存器以测试错误条件。 但是,轮询只能用于更正的错误条件,因为未更正的错误需要操作系统立即关注。

从 Windows Vista 开始,操作系统维护可在特定硬件平台上发现的所有硬件错误源的列表。 当操作系统开始确定特定系统上存在哪些硬件错误源时,WHEA 使用发现机制。 向操作系统公开此信息的方式特定于平台。 操作系统从 ACPI 表、固件交互和其他特定于平台的机制的组合中收集此信息。

注意 Windows Vista 不会从 ACPI 表收集硬件错误源信息。 但是,从 Windows Server 2008 和 Windows Vista SP1 开始,操作系统使用 ACPI 表收集硬件错误源信息。