SQL HADR多个技术概览和比较

对于企业级用户和关键系统来说，最重要的要求之一就是系统的高度可用性和数据的安全性（High Availability and Disaster Recovery，HADR）。我们先来了解一下HADR的问题空间。HADR有两个目标和衡量方式：

保证系统可用
目标恢复时间（Recovery Time Objective，RTO）：出了故障后把系统恢复正常工作状态所需要的时间。
保证数据安全
目标恢复点（Recovery Point Objective，RPO）：系统数据能恢复到故障前的哪个时间点。换而言之，故障后你能容忍多少数据损失。

故障又主要有两大类别：

针对不同的可用性要求和故障类别，SQL Server提供多样的HADR技术来满足用户的需要。但怎样从中选择最合适的技术？下面是对SQL可用性技术和功能的一个概览：

意外宕机时间
- SAN/RAID
- 备份和恢复（Back Up and Restore）
- 日志传送（Log Shipping）
- 数据库镜像（Database Mirroring）
- 故障转移群集（Clustering）复制（Replication）
计划宕机时间
- 轮流升级和打补丁（Upgrade and Patching）
- 在线操作（Online Operations）
- 资源管理器（Resource Governor）
- 数据库快照（Database Snapshot）

SQL Server HADR 技术比较

这些技术都有自己的特点和要求，用户可根据自已需求，配置，和预算来选择，以满足HADR在目标恢复时间（RTO）和目标恢复点（RPO）的要求。

希望您能通过本文对SQL HADR技术有个大致了解，以后我们会再详细介绍其中的一些技术，谢谢。

SQL Engine部门经理
吴家震

Comments

Anonymous
August 07, 2012
数据库复制的问题，能否解答一下！当我执行如下SQL： update table set col='值' 涉及修改的数据量如果超过10万，那么数据库复制同步将变的非常慢。具体时间大概是1万 10秒 2万30秒 10万1个小时 20万4个小时 100万4天。不是线性增长而是指数级增长。我查看了原因，10万数据更新，在复制同步时候是在同一个事务里面，10万事务对应10万个命令，每个命令都产生X锁（在当前数据库和tempdb），而且X锁多了也不升级，最后导致X锁越来越多，越到后面锁匹配越慢，性能越来越差。微软解决方案之一是通过存储过程提交SQL，再复制两端都执行SQL，这样感觉不是很好，因为我只能控制升级脚本这样做，不能控制程序也这样做。另外一个解决方案是我自己想出来的，对更新的系统存储过程加上表锁，这样能解决问题，但是需要批量修改微软提供的底层存储过程，感觉不保险。我觉得微软是不是有一个开关专门设置是否在复制期间开启事务，这样就不会出现大事务造成的N多X锁，导致性能严重下降。求答案！！！！！！