你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 存储操作中的可靠性

本文介绍 Azure 存储操作的可靠性支持,并介绍了可用性区域的区域内部复原能力以及跨区域灾难恢复和业务连续性。 有关 Azure 中可靠性原则的更详细概述,请参阅 Azure 可靠性

Azure 存储操作是一个无服务器框架,可用于跨多个存储帐户对数百万个对象执行常见数据操作。 服务本身是区域性的,没有 SKU 或对可用性区域的支持。 但是,服务的控制平面自动支持区域冗余。 数据平面还可以支持冗余,具体取决于存储帐户是否在区域冗余配置上运行。

可用性区域支持

Azure 可用性区域是每个 Azure 地区内的至少三个在物理上独立的数据中心组。 每个区域中的数据中心都配备了独立的电源、冷却系统和网络基础结构。 在本地区域发生故障的情况下,设计可用性区域,以便一个区域受到影响时,其余两个区域支持区域服务、容量和高可用性。

故障范围包括软件和硬件故障,以及地震、洪水和火灾等事件。 容错是通过 Azure 服务的冗余和逻辑隔离来实现的。 有关 Azure 中可用性区域的详细信息,请参阅地区和可用性区域

已启用 Azure 可用性区域的服务旨在提供适当级别的可靠性和灵活性。 可以通过两种方式进行相关配置。 可以采用区域冗余配置,实现跨区域自动复制,也可以采用区域性配置,将实例固定到特定区域。 还可以将这些方法结合。 有关区域式与区域冗余体系结构的详细信息,请参阅有关使用可用性区域和地区的建议

虽然 Azure 存储操作服务是区域性的且不提供 SKU 或可用性区域,但区域冗余可以从控制平面获得以及有条件地从数据平面获得:

  • 服务的控制平面是区域冗余的。 当某个地区中的区域发生故障时,控制平面仍然可用。 在出现区域关禁闭场景期间,你可以继续管理任务定义和分配。

  • 数据平面(任务分配执行)从父存储帐户继承区域属性。 如果将存储帐户部署到故障区域,则该帐户会变得不可用,并且从客户的角度来看,数据计划不可用。 如果存储帐户是区域冗余的,则该帐户将继续可用,服务将继续对该帐户执行操作。

区域故障体验

在区域关闭场景中,存储操作服务继续可用。 任务的进度取决于运行任务的存储帐户的可用性区域支持。 如果帐户未受到已关闭区域的影响,任务将继续执行。 否则,任务会失败。

区域服务中断准备和恢复

存储操作服务不是区域性的,但存储帐户是。 如果存储帐户受到区域中断的影响,则分配给该帐户的存储任务会失败。 区域和存储帐户变得可用后,计划的任务将继续按计划运行。 如果该任务配置为运行一次,则可能需要安排该任务再次运行。

跨区域灾难恢复和业务连续性

灾难恢复 (DR) 是指从会导致故障时间和数据丢失的高影响事件(例如自然灾害或部署失败)中恢复。 不管灾难的原因是什么,最好的补救措施就是一个定义全面且经过测试的 DR 计划,以及一个主动支持 DR 的应用程序设计。 在开始考虑创建灾难恢复计划之前,请参阅设计灾难恢复策略的建议

在 DR 方面,Microsoft 使用责任共担模型。 在共担责任模型中,Microsoft 会确保基线基础结构和平台服务可用。 同时,许多 Azure 服务不会自动复制数据,也不会从失败区域回退以交叉复制到另一个启用的区域。 对于这些服务,你负责设置适用于工作负载的灾难恢复计划。 大多数在 Azure 平台即服务 (PaaS) 产品/服务上运行的服务都提供支持 DR 的功能和指导,你可以使用特定于服务的功能来支持快速恢复,从而帮助制定 DR 计划。

存储操作是一项区域性服务,它针对同一区域的帐户运行。 当某个区域关闭时,存储帐户和服务也会关闭。 该服务不支持跨区域灾难恢复。 如果触发存储帐户到其他区域的故障转移,则存储任务无法针对该存储帐户运行,直到其故障回复到原始区域为止。 因此,尽管你可能能够恢复存储帐户,但存储任务将无法针对其来运行。

重要

如果将存储帐户从 GRS 或 GZRS 主要区域迁移到次要区域,反或从次要区域迁移到主要区域,将不会触发面向存储帐户的任何存储任务,并且任何现有任务执行可能会失败。

服务中断检测、通知和管理

当服务本身出现中断时,存储任务不会发送任何通知。 检查存储任务的状态并在服务/区域恢复后重试任务非常重要。

后续步骤