你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 用于能源的数据管理器中的可靠性

本文介绍 Azure 用于能源的数据管理器中的可靠性支持,并介绍可用性区域的区域复原能力和灾难恢复时的跨区域复原能力。 有关 Azure 中可靠性的更详细概述,请参阅 Azure 可靠性

可用性区域支持

Azure 可用性区域是每个 Azure 地区内的至少三个在物理上独立的数据中心组。 每个区域中的数据中心都配备了独立的电源、冷却系统和网络基础结构。 在本地区域发生故障的情况下,设计可用性区域,以便一个区域受到影响时,其余两个区域支持区域服务、容量和高可用性。

故障范围包括软件和硬件故障,以及地震、洪水和火灾等事件。 容错是通过 Azure 服务的冗余和逻辑隔离来实现的。 有关 Azure 中可用性区域的详细信息,请参阅地区和可用性区域

已启用 Azure 可用性区域的服务旨在提供适当级别的可靠性和灵活性。 可以通过两种方式进行相关配置。 可以采用区域冗余配置,实现跨区域自动复制,也可以采用区域性配置,将实例固定到特定区域。 还可以将这些方法结合。 有关区域式与区域冗余体系结构的详细信息,请参阅有关使用可用性区域和地区的建议

默认情况下,Azure 用于能源的数据管理器支持区域冗余实例,无需进行其他配置。

先决条件

Azure 用于能源的数据管理器在以下地区支持可用性区域:

美洲 欧洲 亚太区 中东/非洲
美国中南部 北欧 澳大利亚东部 卡塔尔中部
美国东部 西欧
Brazil South

区域故障体验

在区域范围的服务中断期间,无需在区域恢复过程中执行任何操作。 在服务自我修复并重新均衡基础容量以适应运行正常的区域之前,性能可能会短暂下降。 在此期间,可能会遇到 5xx 错误,在还原服务之前,可能需要重试 API 调用。

跨区域灾难恢复和业务连续性

灾难恢复 (DR) 是指从会导致故障时间和数据丢失的高影响事件(例如自然灾害或部署失败)中恢复。 不管灾难的原因是什么,最好的补救措施就是一个定义全面且经过测试的 DR 计划,以及一个主动支持 DR 的应用程序设计。 在开始考虑创建灾难恢复计划之前,请参阅设计灾难恢复策略的建议

在 DR 方面,Microsoft 使用责任共担模型。 在共担责任模型中,Microsoft 会确保基线基础结构和平台服务可用。 同时,许多 Azure 服务不会自动复制数据,也不会从失败区域回退以交叉复制到另一个启用的区域。 对于这些服务,你负责设置适用于工作负载的灾难恢复计划。 大多数在 Azure 平台即服务 (PaaS) 产品/服务上运行的服务都提供支持 DR 的功能和指导,你可以使用特定于服务的功能来支持快速恢复,从而帮助制定 DR 计划。

多区域地理位置中的灾难恢复

Azure 用于能源的数据管理器是一项区域服务,因此容易受到区域中断故障的影响。 Azure 用于能源的数据管理器遵循主动-被动故障转移配置,以从区域灾难中恢复。 主动-被动配置使在次要区域中运行的 Azure 用于能源的数据管理器资源保持活动状态,但除非主要区域发生故障,否则不会向次要区域发送流量。

用于能源跨区域灾难恢复工作流的 Azure 数据管理器的示意图。

下面是支持灾难恢复的区域的主要区域和次要区域列表:

地理位置 次要
美洲 美国中南部 美国中北部
美洲 美国东部 美国西部
美洲 巴西南部*
欧洲 北欧 西欧
欧洲 西欧 北欧
亚太区 澳大利亚东部 澳大利亚
中东/非洲 卡塔尔中部*

(*) 这些区域在支持客户灾难恢复方案中受到限制。 有关详细信息,请联系 Microsoft 销售人员或客户代表。

Azure 用于能源的数据管理器使用 Azure 存储、Azure Cosmos DB 和 Elasticsearch 索引作为基础数据存储来保存数据分区数据。 这些数据存储提供较高的持久性、可用性和可伸缩性。 Azure 用于能源的数据管理器使用异地区域冗余存储 (GZRS) 自动将数据复制到离主要区域数百英里远的次要区域。 在主要区域中启用的相同安全功能(例如,使用加密密钥进行静态加密)来保护数据适用于次要区域。 同样,Azure Cosmos DB 是一种全球分布式数据服务,可跨区域复制元数据(目录)。 Elasticsearch 索引快照按固定时间间隔创建,并异地复制到次要区域。 所有传输中的数据都是临时的,因此可能会丢失。 例如,属于正在进行的引入作业的一部分但尚未保存的传输中数据会丢失,你必须在恢复时重新开始引入过程。

重要

在以下区域中,灾难恢复不可用。 有关详细信息,请联系 Microsoft 销售人员或客户代表。

  1. Brazil South
  2. 卡塔尔中部

设置灾难恢复和中断检测

Azure 用于能源的数据管理器服务会持续监视主要区域中的服务运行状况。 如果在主要区域中检测到硬服务中断故障,我们会尝试恢复,然后代表你发起到次要区域的故障转移。 我们会将故障转移进度告知你。 故障转移完成后,你可以连接到次要区域中的 Azure 用于能源的数据管理器资源并继续操作。 但是,由于次要区域中的任何容量限制,性能可能会略有下降。

管理订阅中的资源

你必须处理连接到 Azure 用于能源的数据管理器资源并托管在同一主要区域中的商业应用程序的故障转移。 此外,你还负责恢复 Log Analytics 工作区中存储的任何诊断日志。

如果在主要区域中设置到 Azure 用于能源的数据管理器资源的专用链接,则必须在配对区域创建第二个指向相同资源的专用终结点。

注意

如果在服务中断之前未启用公共访问网络或创建次要专用终结点,那么你无法再访问次要区域中已故障转移的 Azure 用于能源的数据管理器资源。 只有在主要区域故障回复完成后,才能访问 Azure 用于能源的数据管理器资源资源。

重要

故障转移后,在主要区域故障回复完成之前,将无法对订阅中创建的 Azure 用于能源的数据管理器资源资源进行状态修改。 例如,

  • 无法启用或禁用公共访问网络。
  • 无法批准或拒绝与 Azure 用于能源的数据管理器资源资源的专用终结点连接
  • 无法创建新的数据分区。

后续步骤