你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Chaos Studio 中的故障和操作

在 Azure Chaos Studio 中,作为试验的一部分发生的每个活动称为操作。 最常见的操作类型是错误。 本文介绍操作和故障及其各自的属性。

试验操作

操作是作为混沌实验的一部分安排的任何活动。 操作分为步骤和分支,使操作可以按顺序或并行运行。 每个操作具有以下属性:

  • 名称:发生的特定操作。 例如, urn名称通常采用操作的 URN 形式。
  • 类型:操作的执行方式。 操作可以是连续操作,也可以是离散操作。 连续操作在一段时间内不停地运行。 例如,将 CPU 压力应用于 10 分钟。 离散操作仅发生一次。 例如,重新启动 Azure Redis 缓存实例。

操作的类型

Chaos Studio 中有两种操作:

  • 错误:此操作会导致一个或多个资源中断。
  • 时间延迟:此操作“等待”不会影响任何资源。 在故障之间暂停等待系统受上一个故障影响非常有用。

错误

故障是 Chaos Studio 中最常见的操作。 故障会导致系统中的中断,使你能够验证系统是否有效地处理了该中断,而不会影响可用性。

故障可以:

  • 具有破坏性。 例如,故障可能会终止进程。
  • 应用压力。 例如,故障可能会增加虚拟内存压力。
  • 添加延迟。
  • 导致配置更改。

除了名称和类型之外,错误也可能具有 持续时间(如果连续)和 参数。 参数描述如何应用故障,并且参数特定于故障名称。 例如,“Azure Cosmos DB 故障转移”故障的一个参数是在写入区域发生故障期间将要提升为写入区域的读取区域。 某些参数是必需的,而其他参数是可选的。

故障可以是基于代理的,也可以是“服务直通”的,具体取决于目标类型。 基于代理的故障要求 Chaos Studio 代理安装在虚拟机或虚拟机规模集上。 该代理可用于 Windows 和 Linux,但并非所有故障都可用于这两种操作系统。 有关每个操作系统支持哪些故障的信息,请参阅 Chaos Studio 故障和操作库。 服务直接故障不需要任何代理。 它们直接针对 Azure 资源运行。

错误还包括描述故障所针对的资源的选择器的名称。 若要了解有关选择器的详细信息,请参阅 混沌试验。 如果资源已作为目标载入并且已在资源上启用相应的故障功能,则故障只能影响资源。

后续步骤

现在,你已了解操作和故障,你已准备好: