服务运行状况和连续性

Microsoft 管理员可以查看服务的状态,并找出维护计划的时间。 服务运行状况随时可通过登录获取信息。 如果你使用的是由世纪互联运营的Office 365,下面的某些信息可能不适用。 请改为参阅 世纪互联服务级别协议

查看服务的状态:服务运行状况部分显示服务的当前状态以及有关服务中断和中断的详细信息。 消息中心提供了计划内维护信息。 有关详细信息,请参阅查看服务状态

服务事件: 服务事件是影响服务交付的事件。 服务事件可能是由 Microsoft 数据中心的硬件或软件故障、由于 Microsoft 做出的更改而导致的网络连接故障或重大数据中心挑战(如火灾、洪水或区域灾难)引起的。 由第三方服务提供商引起的中断或客户托管环境中所做的更改不被视为服务事件。 可以使用 Microsoft 技术和流程解决方案,在很短时间内解决大部分服务事件。 然而,一些服务事件更加严重,并会导致长期中断。

服务通知: 有关服务可能不可用的时间,有两种类型的通知: 计划内维护事件计划外停机。

计划内维护事件: 计划内维护是 Microsoft 对基础结构和软件应用程序的定期服务更新。 计划内维护通知告知客户可能影响 Microsoft 服务功能的服务工作。 客户在Microsoft 365 管理中心上通过消息中心收到所有计划内维护的通知,并提前五天通知客户。 Microsoft 通常根据区域时区计划维护服务使用率在历史上处于最低水平的时间。

计划外停机时间: 当其中一个服务因 Microsoft 托管环境中的故障而不可用或无响应时,会发生计划外服务事件。 通过Microsoft 365 管理中心上的服务运行状况通知客户已知服务事件。

最近全球运行时间: 迁移到云服务并不意味着失去了解所发生的情况的能力。 对于 Microsoft 365,它不会。 我们的目标是在运营中做到透明,以便你可以监视服务状态、跟踪问题并了解可用性的历史视图。 下表显示了最近的全球运行时间数据。

注意

此数据不适用于美国政府 DoD 和 GCC High。

年份 第 1 季度 第 2 季度 Q3 第 4 季度
2024 99.97% - - -
2023 99.98% 99.99% 99.99% 99.99%
2022 99.98% 99.98% 99.99% 99.99%
2021 99.97% 99.98% 99.99% 99.98%
2020 99.98% 99.99% 99.97% 99.97%

通知策略: 发生服务事件时,Microsoft 会认识到及时、有针对性的、准确的通信对客户至关重要。 Microsoft 通过Microsoft 365 管理中心上的服务运行状况直接与受影响的客户通信来通知管理员。 服务事件更新按小时节奏提供,如果需要不同的节奏,则会在 SHD 通信发布中说明。

服务运行状况通信通道 --管理员 应用:组织管理员管理员应用使你能够在外出时连接到组织的 Microsoft 服务状态。 Microsoft 管理员将能够查看其移动设备中的服务运行状况信息和维护状态更新。 有关详细信息,请访问管理应用常见问题解答

Microsoft System Center Operations Manager 的 Microsoft 365 管理包: Microsoft System Center Operations Manager (SCOM) 是一个集成管理平台,可帮助你管理数据中心、客户端设备和混合云 IT 环境。 使用 SCOM 的 Microsoft 管理员可以选择导入 Microsoft 365 管理包,该包允许他们在 System Center 中查看 Operations Manager 中的所有服务通信。 使用此工具可以访问已订阅服务的状态、活动和已解决的服务事件以及消息中心通信。 有关详细信息,请在 Microsoft 下载中心获取适用于 Microsoft 365 的 Microsoft System Center 管理包

Graph 中的 Microsoft 365 服务通信 API: Microsoft 365 服务通信 API 允许你以所需方式访问服务通信。 使用此 API,可以创建工具或将工具连接到服务通信,从而可能简化监视环境的方式。 使用服务通信 API 可以监视环境的以下项目:实时服务运行状况和消息中心通信。 有关详细信息,请参阅 Microsoft 365 服务通信 API 参考

事后评审: Microsoft 对持续改进的承诺涉及分析计划外影响客户的服务事件,以尽量减少将来的重复。 计划外服务事件定义为影响服务级别协议 (SLA) 定义的服务使用的多租户服务中断,并且已通过Microsoft 365 管理中心上的服务运行状况进行声明。 对于对大量组织产生广泛而明显影响的计划外客户服务事件,将在事件解决后的 48 小时内通过服务运行状况 (PIR) 进行初步事件后评审,然后在 5 个工作日内完成最终 PIR。

PIR 报告:详细的 PIR 报告包括:用户体验和客户影响、事件开始和结束日期/时间、影响和解决措施的详细时间线,以及为持续改进而采取的根本原因分析和操作。 对于所有其他服务事件,Microsoft 365 管理中心上的服务运行状况页将提供事件关闭摘要,包括事件的最终摘要、根本原因、开始和结束时间,以及详细说明后续步骤的信息。 对于此类型的服务事件,不会生成 PIR。

服务连续性: Microsoft 产品/服务由高度可复原的系统提供,这些系统有助于保持服务性能的峰值。 服务连续性预配是系统设计的一部分。 这些规定使 Microsoft 能够快速从意外事件(例如硬件或应用程序故障、数据损坏或影响用户的其他事件)中恢复。 这些服务连续性解决方案还适用于灾难性中断(例如,自然灾害或 Microsoft 数据中心内的事件导致整个数据中心无法运营)。

中断恢复: 从灾难性中断中恢复后,可能需要一段时间才能为服务还原完整的数据中心冗余。 例如,如果数据中心 1 出现故障,则服务通过数据中心 2 的资源进行还原。 不过,可能需要经过一段时间,数据中心 2 中的服务才会获得服务连续性支持(要么通过数据中心 1 中已还原的资源获得,要么通过数据中心 3 中的新资源获得)。 Microsoft 服务级别协议 (SLA) 在此期间适用。 由世纪互联运营的 Office 365 具有不同的 SLA。 有关详细信息,请参阅 世纪互联站点

确保数据可用性: Microsoft 通过以下功能确保客户数据随时可用: 数据存储和冗余、数据监视完成预防性维护。

数据存储和冗余: 客户数据存储在具有强大数据保护功能的冗余环境中,以支持可用性、业务连续性和快速恢复。 实施了多级数据冗余,从冗余磁盘到防止本地磁盘故障,从完整的持续数据复制到地理分散的数据中心。

数据监视: Microsoft 服务通过监视(数据库、阻止的进程、数据包丢失、排队进程和查询延迟)来保持高级别的性能。

完成预防性维护: 预防性维护包括数据库一致性检查、定期数据压缩和错误日志检查。

报告: Microsoft 管理员可以查看显示组织如何使用 Microsoft 服务的报告。 可以使用这些报告来确定问题、筛选数据并将数据下载到 Microsoft Excel 中。 还可以使用 Microsoft 365 报告 Web 服务创建自己的报表。 Exchange Online和Exchange Online Protection (EOP) 管理员可以使用邮件保护报告来查看有关恶意软件、垃圾邮件和规则检测的数据。 有关详细信息,请参阅 查看和下载有关服务使用情况的报告。 对于由世纪互联运营的 Office 365,请参阅查看和下载由世纪互联运营的 Office 365 报告