你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

云规模分析的业务连续性和灾难恢复

在设计云服务的体系结构时,请考虑可用性要求以及如何响应服务中的潜在中断。 问题可以局限于特定实例或区域范围内。 针对这两者制定计划非常重要。 可以选择激进策略来确保高可用性和灾难恢复,具体取决于恢复时间目标和恢复点目标。

高可用性和灾难恢复有时可以组合在一起。 这两个方面的策略略有不同,尤其是在涉及到数据时。 若要了解有关详细信息,请参阅 Microsoft Azure 架构良好的框架及其可靠性原则

不要尝试防止故障,而是预先接受故障可能发生和确实发生的事实。 将生命周期中任何单个故障组件的影响降至最低。 对成本、恢复点目标和恢复时间目标的容忍度决定了要实现的解决方案的类型。

备份策略

可以使用多种备用策略在区域间实现分布式计算。 策略必须根据业务要求和应用程序的情况量身定制。 大体而言,方法分为以下几类:

  • 备份和还原:从发生灾难之前的最后一个备份副本还原数据库应用程序。 此方法通常用于数据损坏或意外删除之后。

  • 发生灾难时重新部署:发生灾难时从头开始重新部署应用程序。 这种方法适合不需要保证恢复时间的非关键应用程序。

  • 热备用(主动/被动):在备用区域创建辅助托管服务。 部署角色以确保最小容量。 这些角色不会接收生产流量。 对于未设计为在区域间分布流量的应用程序来说,这种方法很有用。

  • 热备份(主动/主动):设计应用程序以接收多个区域的生产负载。 你可能会在每个区域配置容量高于灾难恢复用途所需容量的云服务。 相反,可以在灾难或故障转移时根据需要扩展云服务。

    此方法需要投入应用程序设计,但具有优势。 它提供快速且有保证的恢复时间。 无需持续测试所有恢复位置和容量的有效使用率。 对于数据库应用程序,此方法为与单个连接点同步的两个数据库加入了负载均衡器。

Azure 服务的灾难恢复和高可用性

以下部分讨论不同的 Azure 服务。

Azure Cosmos DB

有关 Azure Cosmos DB 的高可用性概述,请参阅 Azure Cosmos DB 如何提供高可用性

Azure 数据工厂

数据集成和数据产品可能会将 Azure DevOps 存储库链接到 Azure 数据工厂。 可以在最短的停机时间内将管道部署到另一个数据工厂。 若要使用除 GitHub 和 Azure DevOps 存储库以外的代码版本控制软件,请使用 Azure 数据工厂 SDK 创作管道和其他Azure 数据工厂对象。

Azure Data Lake

Azure Data Lake Storage Gen2 已经可以支持 3 个副本形式的复制,来应对局部硬件故障。 区域冗余存储 (ZRS) 或异地区域冗余存储 (GZRS) 等其他复制选项可以改善高可用性。 异地冗余存储 (GRS) 和读取访问异地冗余存储 (RA-GRS) 可改善灾难恢复。 为了实现高可用性,如果服务中断,工作负荷需要尽快访问最新数据。 工作负荷可以切换到本地复制的实例或新区域。

配置为 RA-GRS 或 GRS 的存储帐户可以是灾难恢复计划的一部分,但需要仔细分析恢复点目标 (RPO) 和恢复时间目标 (RTO),并查看其他选项,例如将数据复制到两个不同 Azure 区域的双负载方案。

每个数据登陆区域的数据产品必须具有恢复点目标。 每个数据登陆区域的用例必须具有已定义的复制策略。

注意

具有分层命名空间 (Azure Data Lake Storage Gen2) 的帐户尚不支持客户管理的帐户故障转移。

发生影响主要区域的灾难时,Microsoft 将管理具有分层命名空间的帐户的故障转移。

有关详细信息,请参阅灾难恢复和存储帐户故障转移

Azure Databricks

有关 Azure Databricks 群集的灾难恢复体系结构,请参阅 Azure Databricks 群集的区域灾难恢复

Azure 机器学习

有关 Azure 机器学习的高可用性和灾难恢复概述,请参阅业务连续性和灾难恢复的故障转移

Azure Key Vault

Azure 密钥保管库提供了一些功能来帮助你维护可用性并防止数据丢失。 仅当有充分且重要的业务理由时才备份机密。 备份密钥保管库中的机密可能会带来操作难题,例如在机密过期或轮换时维护多组日志、权限和备份。 有关详细信息,请参阅 Azure 密钥保管库备份

Key Vault 在灾难方案中保持可用性。 它无需用户的任何干预即可将请求转移到配对区域。 有关详细信息,请参阅 Azure Key Vault 可用性和冗余。 作为替代方法,可以考虑将机密和其他 Key Vault 工件存储在具有适当权限的辅助保管库中。 此模式可能适用于要求保管库与应用程序位于同一区域的应用程序。

Azure SQL Database

有关使用 Azure SQL 数据库确保业务连续性的概述,请参阅使用 Azure SQL 数据库确保业务连续性的相关概述

Azure Synapse Analytics

有关使用 Azure Synapse Analytics 确保业务连续性的概述,请参阅 Azure Synapse Analytics 的高可用性

后续步骤