服务运行状况和连续性

Microsoft管理员可以查看服务的状态,并找出维护计划的时间。 通过登录可随时获取服务运行状况信息。 如果你使用的是由世纪互联运营的 Office 365,则下面的某些信息可能不适用。 请改为参阅 世纪互联服务级别协议

查看服务的状态: “服务运行状况”部分显示服务的当前状态以及有关服务中断和中断的详细信息。 消息中心提供了计划内维护信息。 有关详细信息,请参阅查看服务状态

服务事件: 服务事件是影响服务交付的事件。 服务事件可能由Microsoft数据中心的硬件或软件故障、Microsoft更改导致的网络连接故障或火灾、洪水或区域灾难等重大数据中心挑战引起。 由第三方服务提供商引起的中断或客户托管环境中所做的更改不被视为服务事件。 可以使用 Microsoft 技术和流程解决方案,在很短时间内解决大部分服务事件。 然而,一些服务事件更加严重,并会导致长期中断。

服务通知: 有关服务可能不可用的时间,有两种类型的通知: 计划内维护事件计划外停机。

计划内维护事件: 计划内维护是基础结构和软件应用程序的定期Microsoft启动的服务更新。 计划内维护通知告知客户可能影响Microsoft服务功能的服务工作。 通过 Microsoft 365 管理中心的消息中心,不迟于 5 天前通知客户所有计划内维护。 Microsoft通常根据区域时区计划维护服务使用率在历史上处于最低水平的时间。

计划外停机时间: 当其中一个服务因Microsoft托管环境中的故障而不可用或无响应时,会发生计划外服务事件。 客户通过 Microsoft 365 管理中心上的服务运行状况收到已知服务事件的通知。

最近全球运行时间: 迁移到云服务并不意味着失去了解所发生的情况的能力。 对于 Microsoft 365,则不会。 我们的目标是在运营中做到透明,以便你可以监视服务状态、跟踪问题并了解可用性的历史视图。 下表显示了最近的全球运行时间数据。

注意

此数据不适用于美国政府 DoD 和 GCC High。

年份 第 1 季度 第 2 季度 Q3 第 4 季度
2024 99.97% 99.99% - -
2023 99.98% 99.99% 99.99% 99.99%
2022 99.98% 99.98% 99.99% 99.99%
2021 99.97% 99.98% 99.99% 99.98%
2020 99.98% 99.99% 99.97% 99.97%

通知策略: 发生服务事件时,Microsoft认识到及时、有针对性的、准确的通信对客户至关重要。 Microsoft通过 Microsoft 365 管理中心上的服务运行状况直接与受影响的客户通信来通知管理员。 服务事件更新按小时节奏提供,如果需要不同的节奏,则会在 SHD 通信发布中说明。

服务运行状况通信通道 --管理员应用: 组织管理员的管理员应用使你能够在外出时连接到组织的Microsoft服务状态。 Microsoft管理员将能够从其移动设备查看服务运行状况信息和维护状态更新。 有关详细信息,请访问管理应用常见问题解答

适用于 Microsoft System Center Operations Manager 的 Microsoft 365 管理包: Microsoft System Center Operations Manager (SCOM) 是一个集成管理平台,可帮助你管理数据中心、客户端设备和混合云 IT 环境。 Microsoft使用 SCOM 的管理员可以选择导入 Microsoft 365 管理包,以便查看 System Center 中 Operations Manager 中的所有服务通信。 使用此工具可以访问已订阅服务的状态、活动和已解决的服务事件以及消息中心通信。 有关详细信息,请在Microsoft下载中心获取 适用于 Microsoft 365 的 Microsoft System Center 管理包

图形中的 Microsoft 365 服务通信 API: Microsoft 365 服务通信 API 允许你以所需方式访问服务通信。 使用此 API,可以创建工具或将工具连接到服务通信,从而可能简化监视环境的方式。 使用服务通信 API 可以监视环境的以下项目:实时服务运行状况和消息中心通信。 有关详细信息,请参阅 Microsoft 365 服务通信 API 参考

事后评审: Microsoft对持续改进的承诺涉及分析计划外影响客户的服务事件,以尽量减少将来的重复。 计划外服务事件定义为影响服务级别协议 (SLA) 定义的服务使用情况的多租户服务中断,并且已通过 Microsoft 365 管理中心的服务运行状况进行声明。 对于对大量组织产生广泛而明显影响的计划外客户服务事件,将在事件解决后的 48 小时内通过服务运行状况提供初步事件后评审 (PIR) ,然后在 5 个工作日内完成最终 PIR。

PIR 报告: 详细的 PIR 报告包括:用户体验和客户影响、事件开始和结束日期/时间、影响和解决措施的详细时间线,以及为持续改进而采取的根本原因分析和操作。 对于所有其他服务事件,Microsoft 365 管理中心的服务运行状况页将提供事件关闭摘要,包括事件的最终摘要、根本原因、开始和结束时间,以及详细说明后续步骤的信息。 对于此类型的服务事件,不会生成 PIR。

服务连续性: Microsoft产品/服务由高度可复原的系统提供,这些系统有助于保持服务性能的峰值。 服务连续性预配是系统设计的一部分。 这些规定使Microsoft能够快速从意外事件(例如硬件或应用程序故障、数据损坏或影响用户的其他事件)中恢复。 这些服务连续性解决方案还适用于灾难性中断(例如,自然灾害或 Microsoft 数据中心内的事件导致整个数据中心无法运营)。

中断恢复: 从灾难性中断中恢复后,可能需要一段时间才能为服务还原完整的数据中心冗余。 例如,如果数据中心 1 出现故障,则服务通过数据中心 2 的资源进行还原。 不过,可能需要经过一段时间,数据中心 2 中的服务才会获得服务连续性支持(要么通过数据中心 1 中已还原的资源获得,要么通过数据中心 3 中的新资源获得)。 在此期间,Microsoft 服务级别协议 (SLA) 适用。 由世纪互联运营的 Office 365 具有不同的 SLA。 有关详细信息,请参阅 世纪互联站点

确保数据可用性: Microsoft通过以下功能确保客户数据随时可用: 数据存储和冗余、数据监视完成预防性维护。

数据存储和冗余: 客户数据存储在具有强大数据保护功能的冗余环境中,以支持可用性、业务连续性和快速恢复。 实施了多级数据冗余,从冗余磁盘到防止本地磁盘故障,从完整的持续数据复制到地理分散的数据中心。

数据监视: Microsoft服务通过监视(数据库、阻止的进程、数据包丢失、排队进程和查询延迟)来保持较高的性能级别。

完成预防性维护: 预防性维护包括数据库一致性检查、定期数据压缩和错误日志检查。

报告: Microsoft的管理员可以查看显示组织如何使用Microsoft服务的报告。 可以使用这些报告来确定问题、筛选数据并将数据下载到 Microsoft Excel 中。 还可以使用 Microsoft 365 报告 Web 服务创建自己的报表。 Exchange Online 和 Exchange Online Protection (EOP) 管理员可以 使用邮件保护报告来查看有关恶意软件、垃圾邮件和规则检测的数据。 有关详细信息,请参阅 查看和下载有关服务使用情况的报告。 对于由世纪互联运营的 Office 365,请参阅查看和下载由世纪互联运营的 Office 365 报告