Azure 服务运行状况的工作原理

已完成

构成 Azure 服务运行状况的三项服务中的每一项都以不同的方式工作。

Azure 状态

在“Azure 状态页”中,可以找到所有区域中有关 Azure 服务运行状况的公开信息。

在页面上,可以将自动刷新周期设置为:

  • 2 分钟
  • 5 分钟
  • 10 分钟
  • 30 分钟

如果你希望将此信息显示在 NOC(网络运营中心)的监视器中,你可能会发现这非常有用。 使用刷新频率,你可以根据服务审核需要自定义显示的信息。

状态页包含按地理位置和区域列出的所有产品和服务。 有四种类型的状态指示器可用。 借助这些指标,你可以通过确定服务是否良好、是否有关于该服务的特定信息,或者是否存在代表警告或严重问题的迹象,轻松识别服务运行状况。

提示

你还会注意到表中有空白区域。 这些空白区域表示服务在列出的区域中不可用。

你还可以选择获取 RSS 源,以便在服务运行状况方面提供更新。 可以在此页上的标题区域右上部分找到 RSS 标记。

Screenshot of the Azure Service Status Page displaying the public information about the health of Azure services among the different geographies.

服务运行状况

可以通过服务运行状况获取有关中断、计划内维护、运行状况和安全建议的信息。

使用服务运行状况,你可以创建自定义视图,在订阅、区域和服务之间进行筛选。 详细信息级别包括:

  • 问题名称
  • 受影响的订阅、服务和区域
  • 开始时间
  • 摘要和问题更新
  • 根本原因分析
  • 可下载的 PDF 与说明

使用服务运行状况,你还可以创建运行状况警报,方便系统在出现问题时通知你。

资源运行状况

资源运行状况每分钟都会在资源上执行一些检查,并将信息提供给你使用。 有一种特定类型的资源可运行运行状况检查。 可以在此页上查看完整的列表资源类型

例如,对于虚拟机,执行的检查类型包括:

  • 托管此虚拟机的服务器是否已启动并运行?
  • 主机操作系统 (OS) 启动是否已完成?
  • 是否存在持续的计划内维护?
  • 主机硬件是否已降级并预计很快会发生故障?

对于 Azure 上的特定资源类型可,在 Azure 门户中的“支持 + 故障排除”边栏选项卡使用“资源运行状况”。

Screenshot of Azure Resource Health with the health history of a specific virtual machine

Azure 服务运行状况的主要功能有哪些?

在此部分,我们列出了 Azure 服务运行状况的主要功能。 我们将查看每个功能的详细信息。

个性化仪表板

借助 Azure 服务运行状况,可创建个性化仪表板(视图),以便筛选订阅、区域和服务。 由此,你可根据对环境更重要/关键的信息自定义可供查看的信息。

Screenshot depicting an example of a Personalized Dashboard with multiple subscriptions selected across two regions.

可配置的云警报

你可以根据所做的选择添加服务运行状况警报,并选择你想要接收有关哪类事件的通知。

Screenshot depicting configuration of an alert rule. The image shows four event types selected for a single subscription.

包含问题详细信息的可共享文档

对于任何服务问题、计划内维护、运行状况或安全建议,可以下载包含相关信息的 PDF 文档。 选择问题后,可以看到摘要信息以及将所有信息下载为 PDF 文档的选项。 例如,当你需要通过电子邮件共享详细信息时,你可能会发现此 PDF 很有用。 PDF 包含事件类型、状态、受影响的服务、区域、受影响的订阅、更新历史记录,以及其他详细信息。

Screenshot with a summary of a Log Analytics issue showing details such as Tracking ID, Impacted regions, Impacted subscription, Last updates, Preliminary Root Cause, and a link to Download the summary as PDF.

事件发生时的指导和支持

如果发生事件,可找到有关解决方法或可采取操作的指导和相关信息,以最大程度地降低影响以及所有问题更新。

Screenshot of an issue showing the guidance and workaround suggested.