简介

已完成

无论计划得多好,有时候还是会出错。 拥有和管理 IT 资源的组织必须计划最糟糕的情况,并假设在将来会出现最坏的情况。 灾难规划和恢复是 IT 的最关键要素之一。

新式云平台提供了多种工具,可帮助组织为不利情况做好准备并在发生不利情况时减轻其影响。 例如,基于云的备份服务可以复制本地存储的数据,以便在数据被删除、损坏或破坏的情况下可以将其还原。 也可以备份 IaaS 资源,例如虚拟机和 SQL 工作负载。 一些 PaaS 服务具有自动备份功能。 例如,Azure SQL 数据库每周创建一次完整备份,每隔 12 小时创建一次差异备份,每隔几分钟创建一次事务日志备份。 备份存储在已复制到配对的数据中心的异地冗余存储中。 丢失或损坏的数据库很容易从备份还原到过去选择的时间。

数据丢失并不是 IT 专业人员必须计划的唯一“灾难”。 完整的灾难恢复计划还要确保业务的连续性,例如,当应用程序无响应或整个公有云区域出现故障时,将请求重定向(故障转移)到次要位置。 在这一方面,云通过提供灾难恢复即服务 (DRaaS) 也是有帮助的。 目前,系统结构的目标是避免对任何可能成为单点故障的部件的依赖。 这是复原能力的指导原则:允许甚至计划系统内的合理程度的故障,同时保持组织及其客户可接受的服务水平。

在本模块中,我们首先全面介绍 bug、故障和失败。 接下来,我们介绍用于备份应用程序、服务和数据的复制方法,以最大程度地降低业务损失的可能,并了解主要云服务提供商提供的备份服务。 在这里,我们将深入了解灾难恢复、DRaaS 和实现业务连续性的机制。 最后,我们讨论云计算中的复原能力的原则如何改变组织将应对措施转换为防范措施的准备方法。

学习目标

  • 了解“容错”的含义
  • 列出用于在云平台中实现容错的应对方法
  • 列出用于在云平台中实现容错的防范方法
  • 了解主要云服务提供商提供的备份服务
  • 了解备份服务在灾难响应和恢复中的作用
  • 说明备份服务和灾难恢复服务之间的区别
  • 列出驱动灾难恢复计划的服务级别目标
  • 列出主要云服务提供商提供的灾难恢复服务
  • 说明什么是复原能力,以及如何对其进行衡量
  • 说明复原能力如何影响业务连续性

必备知识

  • 了解什么是云计算,包括云服务模型和常见云提供商
  • 了解不同类型的云(公有云、私有云、混合云)
  • 认识云服务模型(例如 IaaS、PaaS 和 SaaS),并加以区分
  • 了解云资源预配的工作方式
  • 了解数据中心的工作方式,以及数据在云中的存储方式
  • 了解云安全性的基础知识