群集连续复制恢复行为

 

适用于: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上一次修改主题: 2007-10-29

群集连续复制 (CCR) 可以同时为数据以及为数据提供访问支持的服务提供完整冗余。在邮箱数据的共享副本不允许快速恢复的情况下,完整冗余可以支持快速恢复。

CCR 恢复行为可以分为以下两种中断:

  • 计划中断   计划中断由管理员启动。计划中断可用于从监视系统检测到的故障中恢复或执行某项管理任务(例如硬件维护、软件安装或软件新)。

  • 非计划中断   非计划中断由系统发起,作为恢复检测到的故障的操作。Windows 群集服务检测到这些中断并触发它们的恢复。

下表描述了对各种故障需要执行的恢复操作。有些故障要求管理员启动恢复,有些故障则由 Exchange 群集解决方案自动处理。

恢复故障的操作

说明 操作 注释

操作系统停止错误;检测到操作系统挂起(停止响应);节点电源完全中断;处理器芯片、母板以及底板不可恢复的故障;或节点的通信完全失败

如果可以,会自动故障转移到被动节点。如果在所配置的时间段内尚未发生恢复,则管理员还可以选择不考虑数据丢失的强制自动装入。如果在故障转移之后未装入任何数据库并且原来的主动节点已重新联机,主动节点的所有存储设备均正常工作,则将复制丢失的日志并自动装入数据库。

要使被动节点可用,必须能够在出现故障之后建立仲裁。这意味着剩余节点必须能够访问文件共享仲裁。此外,群集中的大多数节点必须工作正常,并且能够相互通信。

主动服务器上总存储故障

存储故障会报告给监视系统并通过监视系统报告。管理员可以恢复存储或对被动节点启动计划中断。

此故障将报告为所有数据库的故障。

数据中心故障

如果主数据中心中的主动节点出现故障,则会将群集邮箱服务器自动故障转移到第二个数据中心中的被动节点。

必须先恢复其他 Exchange、目录服务、网络服务和服务器,才能继续访问邮件。几分钟内,邮件数据可以使用并且是最新的。

操作系统驱动器故障

不执行自动恢复操作。除非操作系统出现故障,否则,Exchange 不会检测到该故障。对该故障的检测基于明显的故障而不是根本原因。

操作系统驱动器故障由操作系统监视服务报告,可能会使操作系统出现故障。

操作系统驱动器空间不足

自动故障转移到被动节点(如果可用)。

该故障会报告给监视服务并通过监视系统报告。如果自动恢复不会发生或者不能发生,则此方案的恢复操作由管理员确定。

群集的公用网络发生完全故障

不执行自动恢复操作。

如果公共网络断开,IP 地址资源将进入失败状态。公共网络问题得到解决后,资源即可重新联机。

丢失群集仲裁

群集邮箱服务器和群集仲裁脱机。

如果无法形成仲裁,此方案将导致服务无法提供。

信息存储故障

自动重新启动信息存储资源。如果信息存储资源故障发生在重新启动期间,则会触发故障转移。

如果重复出现故障,管理员可以尝试手动将群集邮箱服务器移动到被动节点,尝试使其联机。

应用程序(二进制文件)驱动器故障

不执行自动恢复操作。

通常情况下,此方案会导致其他故障,这些故障会报告给监视服务并通过监视服务报告,还可以由管理员来处理。此方案的恢复操作由管理员确定。

应用程序(二进制文件)驱动器空间不足

不执行自动恢复操作。

报告给监视服务并通过监视服务报告。此方案的恢复操作由管理员确定。

数据库或存储组完全丢失,或数据库完全失败

自动尝试重新装入受影响的数据库。如果该尝试失败,数据库仍处于失败状态,但是不会对群集邮箱服务器进行任何故障转移。

存储组或数据库或者由于软件故障或损坏而被卸除,或由于硬件故障而出现故障。例如,存储组在其日志目录不可用时强制卸除所有数据库。管理员确定更正操作。

存储组部分故障或数据库部分故障,某些数据不可用或初始数据库装入失败

不执行自动恢复操作。

部分故障意味着某些损坏已报告,但损坏不会强制卸除存储组或数据库。如果在启动时不装入数据库,则不执行操作,并且监视服务会报告该故障。检测到监视服务可以报告时,邮箱服务器将生成事件。监视服务还将检测并报告已卸除的数据库。

检测到存储组的损坏日志

不执行自动恢复操作。副本进入中断状态,必须重新设定种子。

监视服务将报告此情况。

数据库或事务日志驱动器空间不足

不执行自动恢复操作。将卸除存储组中的数据库。

通过监视系统报告可用驱动器空间不足的情况。管理员确定更正操作。

管理员可以通过配置来控制非计划中断的故障恢复。有关计划中断和非计划中断的详细信息,请参阅计划中断和未计划中断