简介

已完成

务必持续监视任务关键型工作负载的应用程序组件,以便尽早发现性能下降并避免中断。

设计良好的应用程序运行状况模型通过使用指标和阈值(你认为对工作负载很重要)来提供这种功能。 通过优化的查询和可视化,可以快速识别降级系统组件的级联影响,并在发生中断之前排查问题。

示例方案

从两年前自本地环境迁移到云中后,Contoso Shoes 在运营方面有所改进。 但保持其在服务级别协议中的可用性和运行时间仍然是公司面临的挑战。 某些产品发布导致中断,因为系统无法满足增加的用户负载需求。

为防止进一步发生可避免的中断,Contoso Shoes 成功将任务关键型工作负载的设计原则应用到其面向客户的主要 Web 应用程序(商店网站)中。

在 Contoso Shoes 准备其下一个高端产品发布时,公司发现他们对其 Web 应用程序的健康状况和可用性的认知存在差距。 员工使用此应用程序来更新产品目录。 他们的客户通过商店网站与目录进行交互。 预计在发布期间流量会增加,并且对应用程序运行状况的监视和了解不足是一种潜在风险。

在本模块中,你将使用此 Web 应用程序作为核心示例。 练习涵盖了以下任务:

  • 为应用程序设计多层运行状况模型结构。
  • 构建运行状况模型并在运营仪表板中可视化可观察性数据。
  • 在应用程序中设计查询和运行状况终结点,以在 API 级别检查其运行状况和依赖项。

重要

这些练习并未涵盖任务关键型工作负载的运行状况建模的所有方面。 完成本模块后,请继续探索任务关键型工作负载的运行状况建模中的运行状况建模原则,以全面了解自己的运行状况建模设计。