简介

已完成

云环境由分散在不同地理位置的不同服务组成。 这些地域由多个区域和数据中心组成。 最终,这意味着,即使有了所有抽象级别,云环境也由云提供商管理的数据中心提供支持。

数据中心需要计划内维护、硬件升级、故障转移测试等,以改善其复原能力。 考虑到这一点,如何了解数据中心内 Azure 服务的运行状况? 答案是 Azure 服务运行状况。 Azure 服务运行状况提供 Azure 服务状态和区域的个性化视图,并提供计划内维护和当前事件的相关信息。 它还提供丰富的功能,包括警报、运行状况公告和根本原因分析。

Screenshot of Azure Service Health showing the overall information provided

示例方案

作为 IT 管理员,你开始从开发人员团队那里接收有关在 Azure 上运行的某些虚拟机内的应用程序运行缓慢的查询。

你开始检查服务器,查找问题所在。 你检查应用程序组件、消息队列、连接性、日志和警报,但找不到任何可以解释响应缓慢的行为的任何内容。

在花费了很多时间进行调查后,你发现云服务提供商有一个问题。 标识的问题导致在特定区域中部署的虚拟机上出现延迟。

这就是 Azure 服务运行状况使用情况的一个示例,它可帮助你事先确定问题的来源并启动操作计划来解决问题。 相反,你必须花费大量时间来进行调查以确定根本原因。 为跟踪特定 Azure 区域中虚拟机的运行状况而创建的简单运行状况警报会在问题开始时立即通知你。

我们将执行哪些操作?

在此模块中,我们将评估 Azure 服务运行状况提供的信息类型,以帮助你了解云资源的运行状况。

主要目标是什么?

本节课结束后,你可使用 Azure 服务运行状况来创建与资源相关的服务问题、计划内维护、运行状况和安全建议的感知。 你还将了解如何创建运行状况警报。