规划群集连续复制

 

适用于: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上一次修改主题: 2008-07-23

尽管部署群集连续复制 (CCR) 与部署本地连续复制 (LCR) 和部署单一副本群集 (SCC) 类似,但是必须考虑到一些重要的差异。存在一些必须满足 CCR 的一般要求,以及必须满足的硬件、软件、网络连接和群集要求。

群集连续复制的一般要求

在部署 CCR 之前,请确保整个系统满足以下要求:

  • 必须为每个存储组使用一个数据库。在 CCR 环境中创建一个存储组时,该存储组只能包含一个数据库。此方法将创建一个更加容易管理的 Microsoft Exchange 存储拓扑,可以提高可恢复性。

  • 域名系统 (DNS) 必须在运行。理想情况下,DNS 服务器应该接受动态更新。如果 DNS 服务器不接受动态更新,则必须为每个群集邮箱服务器和群集本身创建一个 DNS 主机 (A) 记录。否则,Exchange 不能正常运行。有关如何为 Exchange 配置 DNS 的详细信息,请参阅 Microsoft 知识库文章 322856 如何配置 DNS 以用于 Exchange Server

  • 如果群集节点属于某个目录命名服务区域,而该区域的名称与计算机所加入的 Active Directory 目录服务域的名称不同,那么,默认情况下 DNSHostName 属性不包含子域名。在这种情况下,可能需要更改 DNSHostName 属性以确保某些服务(如文件复制服务 (FRS))正常工作。有关详细信息,请参阅知识库文章 240942 Active Directory DNSHostName 属性不包含子域

  • 所有群集节点必须是位于同一域中的成员服务器。在同时也是 Active Directory 服务器的节点上,或是不同 Active Directory 域的成员的节点上,不支持 Microsoft Exchange Server 2007。

  • 在安装 Exchange 2007 之前必须已形成群集。有关形成 Windows Server 2008 故障转移群集的信息,请参阅在 Windows Server 2008 上安装群集连续复制。有关形成 Windows Server 2003 故障转移群集的信息,请参阅安装单一副本群集

  • 群集邮箱服务器 (CMS) 名称最多可包含 15 个字符。

  • 安装了 Exchange 2007 的群集不得包含 Exchange Server 2003、Exchange 2000 Server 或任何群集感知版本的 Microsoft SQL Server。不支持在包含上述任何其他应用程序的群集中运行 Exchange 2007。允许在包含 SQL Server 2005 Express Edition 或其他数据库应用程序(例如 Microsoft Office Access)的群集中运行 Exchange 2007,条件是该数据库应用程序是非群集应用程序。

  • 在安装 Exchange 2007 之前,请确保要安装 Exchange 数据的文件夹为空。

  • 必须在群集中所有已配置为群集邮箱服务器的主机的节点上安装相同版本的 Exchange 2007。此外,群集中所有节点的操作系统和 Exchange 文件必须安装在相同的路径和驱动器中。这要求所有计算机的磁盘配置要尽量类似(尽管不是完全相同)。

  • 群集服务帐户必须是能够驻留群集邮箱服务器的每个节点上的本地管理员组的成员。

  • 不要安装、创建或将任何资源从默认的群集组移动到包含群集邮箱服务器的资源组。而且也不要安装、创建或将任何资源组从包含群集邮箱服务器的组移动到默认的群集组。默认群集组应仅包含群集 IP 地址、网络名称和仲裁资源。不支持将资源移动到默认的群集组或将资源与默认的群集组组合。

    important要点:
    运行 Exchange 以前版本的群集需要 Microsoft 分布式事务处理协调器 (MSDTC) 的一个群集实例。Exchange 2007 去除了群集 MSDTC 资源的这个需求。CCR 环境中的群集邮箱服务器不使用 MSDTC 资源,也不需要在故障转移群集中安装 MSDTC 资源。由于存在 COM+ 依存关系,第三方应用程序可能需要 MSDTC 资源。在 Windows Server 2003 中,MSDTC 群集资源要求在群集中使用共享存储。不建议将共享存储添加到 CCR 环境。Windows Server 2008 提供了本地非群集 MSDTC 实例,去除了 Windows Server 2008 故障转移群集中共享存储的这个需求。有关 Windows Server 2008 中 MSDTC 更改的详细信息,请参阅 Windows Server 2008。

群集连续复制的硬件要求

有关硬件规划的一般信息,请参阅规划处理器配置规划磁盘存储。CCR 环境的特定硬件要求如下:

  • 在 Windows Server 2003 中使用包含文件共享见证的多数节点集 (MNS) 仲裁时,群集中只能恰好有两个节点。如果群集中有一个节点或两个以上的节点,则无法使用包含文件共享见证功能的 MNS 仲裁。而必须使用传统的 MNS 仲裁,该仲裁要求群集中有三个或更多节点。

  • 在 Windows Server 2008 中使用多数节点和文件共享仲裁时,群集中只能恰好有两个节点。如果群集中有一个节点或两个以上的节点,则无法使用多数节点和文件共享仲裁。而必须使用多数节点仲裁,该仲裁要求群集中有三个或更多节点。

    note注意:
    我们建议使用两节点故障转移群集,该群集使用包含文件共享见证的 MNS 仲裁或多数节点和文件共享仲裁。这消除了在群集中包含第三个投票者节点的需求。
  • 使用的服务器必须在安装它们的操作系统的 Microsoft Windows Server Catalog of Tested Products 中列出。但是,如果在群集中没有使用共享存储,则这些服务器不需要在“群集类别”中列出。

  • 安装邮箱服务器角色的两台服务器在以下方面必须相当但是不相同:

    • CPU

    • 内存

    • 输入/输出 (I/O) 能力

    • 网络

    • 供应商

    • 可用磁盘存储空间,包括空间操作和 I/O 操作功能

群集连续复制的仲裁要求

通常,群集应用程序意识不到安装它们的群集所使用的仲裁的类型。为 CCR 环境设计仲裁组件时,请注意下列建议和要求:

  • 在 Windows Server 2008 中,多数节点和文件共享仲裁是为 CCR 强烈推荐的仲裁类型。

  • 在 Windows Server 2003 中,包含文件共享见证的 MNS 仲裁是为 CCR 强烈推荐的仲裁类型。

不管为 CCR 使用了上述哪一种仲裁类型,这些节点都不必在 Microsoft Windows Server Catalog of Tested Products 中列出。

如果为 CCR 使用的是共享存储仲裁,则整个系统必须在 Microsoft Windows Server Catalog of Tested Products 中列出。

在 Exchange Server 2007 Service Pack 1 (SP1) 中,如果没有配置文件共享见证或多数文件共享,安装程序会阻止两节点群集配置。这是因为配置将不能处理在群集中丢失节点的情况(因为多数不会得到维护),从而导致群集脱机。

群集连续复制的软件要求

CCR 环境的软件要求如下:

  • 群集中的两个节点都必须使用相同的引导驱动器号和系统驱动器号将 Windows Server 2008 企业版操作系统或 Windows Server 2003 企业版操作系统安装在群集的每个节点上。不存在其中一个节点运行 Windows Server 2008 而另一个节点运行 Windows Server 2003 的群集。不支持在故障转移群集中混合操作系统版本。

  • 如果要在 Windows Server 2003 上使用 Exchange 2007 的正式发布 (RTM) 版本构建 CCR 环境,则故障转移群集中的两个节点必须已安装 Windows Server 2003 Service Pack 2 (SP2) 或 Windows Server 2003 SP1 和来自知识库文章 921181(用于向基于 Windows Server 2003 Service Pack 1 的服务器群集添加文件共享见证功能和可配置群集检测信号功能的更新已推出)的修补程序。此修补程序包括在 Windows Server 2003 SP2 中。如果要在 Windows Server 2003 上使用 Exchange 2007 SP1 构建 CCR 环境,则故障转移群集中的两个节点必须已安装 Windows Server 2003 SP2。

  • 该群集必须是带有传统 MNS 仲裁的三节点群集或带有包含文件共享见证的 MNS 仲裁的二节点群集。通常,会假定在 Windows Server 2003 中,将使用具有包含文件共享见证的 MNS 仲裁的两节点群集,而在 Windows Server 2008中,将使用具有多数节点和文件共享仲裁的两节点群集。

  • MNS 或多数文件共享仲裁的文件共享见证不需要位于一台专用的计算机上。它可位于运行 Windows Server 的任何计算机上。但是,建议您使用要受 Exchange 管理员控制的集线器传输服务器(或其他 Exchange 服务器)来驻留文件共享见证。

  • 只有邮箱服务器角色才能安装在群集中。任何其他服务器角色都不能安装在属于故障转移群集的计算机上。

群集连续复制的网络要求

用于客户端和群集通信的网络一定要配置正确。此部分提供了验证专用和公用网络设置是否正确配置时必须执行的步骤的链接。此外,必须确保为群集正确配置了网络连接顺序。为 CCR 环境设计网络基础结构时,请考虑下列事项:

  • 每个节点必须至少具有两个可用于 Windows 群集的网络适配器。客户端和其他服务器只需能够从两个网络适配器之一访问节点即可。其他网络适配器用于群集间通信。建议的配置是配备专用于内部群集通信的专用网络和指定为混合型的公用网络。

  • 群集公用网络应提供与其他 Exchange 服务器或其他服务(例如 Active Directory 和 DNS)的连接。使用网络适配器成组或类似的技术可以避免发生单点故障。

  • 必须提供独立的群集专用网络。专用网络用于群集检测信号。专用网络不需要 DNS。

  • 对于双数据中心配置,检测信号要求可能不是最严格的公用网络带宽和延迟要求。必须评估网络总负载(其中包括客户端访问、Active Directory、传输、连续复制和其他应用程序通信)以确定您的环境所需的网络要求。

  • 建议您将 Gigabit 以太网用于 CCR 环境以最大限度地延长重新设定种子的时间。有关为何建议使用 Gigabit 以太网的详细信息,请参阅本主题后面的“数据库大小和群集连续复制”。

  • 在 Exchange 2007 RTM 中,包含群集邮箱服务器的资源组只能具有一个网络名称资源。在 Exchange 2007 RTM 中不支持在包含群集邮箱服务器的资源组中拥有多个网络名称资源。但是,在 Exchange 2007 SP1 中不存在此限制。如果已将群集邮箱服务器升级到 Exchange 2007 SP1,则可以在包含群集邮箱服务器的资源组中存在多个网络名称资源。

在 Windows Server 2008 上安装 CCR 的网络要求

在 Windows Server 2008 上安装 CCR 的网络要求与在 Windows Server 2003 上安装 CCR 的要求稍有不同。与 Windows Server 2003 一样,如果要在 Windows Server 2008 上安装 CCR,则必须具有足够的可用于两个节点和群集邮箱服务器 (CMS) 的 IP 地址。但是,还有一些其他选项在 Windows Server 2008 中可用,在 Windows Server 2003 中却不可用:

  • 群集节点可以驻留在不同子网上。在 Windows Server 2003 中,每个节点上每个网络的网络接口必须与其他节点上的对应网络位于同一子网上。Windows Server 2008 中不存在此要求。因此,故障转移群集中的节点可以跨网络路由器进行通信,无需使用虚拟 LAN (VLAN) 技术即可连接节点。

  • 在 CCR 环境中使用多个子网时,DNS 复制可能会影响客户端在节点之间发生 CMS 故障转移或切换后重新连接到 CMS 的能力。对于 IP 地址已更改的群集邮箱服务器,在使用新 IP 地址更新 DNS 并更新所有本地 DNS 高速缓存前,与其通信的客户端和其他服务器将无法重新建立与该服务器的连接。为尽量缩短将 DNS 更改通知到客户端和其他服务器的时间,建议您将群集邮箱服务器的网络名资源的 DNS 生存时间 (TTL) 值设置为五分钟。在大多数环境中,建议只为 CMS 网络名称资源设置 DNS TTL 值。不过,在使用非 Exchange 管理工具按名称连接到群集进行管理的环境中,建议为群集网络名称资源设置较低的 TTL 值。有关如何配置网络名资源的 DNS TTL 值以在多子网 CMS 或备用群集部署中使用的详细步骤,请参阅如何为网络名称资源配置 DNS TTL 值

  • 在 Windows Server 2008 故障转移群集中,群集 IP 地址资源可以从动态主机配置协议 (DHCP) 服务器以及通过静态表项获取它们的地址。如果群集节点本身被配置为从 DHCP 服务器获取其 IP 地址,默认行为将是自动为所有群集 IP 地址资源获取 IP 地址。如果群集节点具有静态分配的 IP 地址,则群集 IP 地址资源也必须使用静态 IP 地址进行配置。因此,群集 IP 地址资源 IP 地址分配遵循物理节点的配置和该节点上的每个特定接口。不建议将 DHCP 用于群集邮箱服务器。在将 DHCP 用于 CMS 之前,建议考虑下列情况:

    • 如果 IP 地址发生更改,则群集服务不会将已启用 DHCP 的 IP 地址资源联机。

    • 应该将 DHCP 服务器配置为对群集邮箱服务器所用的所有 DHCP 分配的地址授予无限期租约。

  • Windows Server 2008 及其群集服务还支持 Internet 协议版本 6 (IPv6)。这包括可以支持群集中单独或组合的 IPv6 IP 地址资源和 IPv4 IP 地址资源。此外,故障转移群集还支持站内自动隧道寻址协议 (ISATAP),它们只支持允许在 DNS (AAAA 主机记录和 IP6.ARPA 反向查找区域)中进行动态注册的 IPv6 地址。仅当在运行 Windows Server 2008 的计算机上部署了 Exchange 2007 SP1,并且该计算机上同时启用了 IPv6 和 IPv4,同时网络支持这两种 IP 地址版本时,才支持使用 IPv6 地址和 IP 地址范围。如果 Exchange 2007 SP1 在此配置中部署,则所有服务器角色都可在使用 IPv6 地址的设备、服务器和客户端中发送和接收数据。Windows Server 2008 的默认安装支持 IPv4 和 IPv6。如果 Exchange 2007 SP1 安装在 Windows Server 2003 中,则不支持 IPv6 地址。有关 Exchange 2007 SP1 支持 IPv6 地址的详细信息,请参阅 Exchange 2007 SP1 和 SP2 中的 IPv6 支持

在 Windows Server 2003 上安装 CCR 的网络要求

如果要在 Windows Server 2003 上安装 CCR,则在双节点 CCR 环境中创建群集邮箱服务器时,必须有足够数量的可用静态 IP 地址。群集和群集邮箱服务器需要 IP 地址。此外,每个节点上的公用和专用网络都需要 IP 地址:

  • 专用地址 在每个节点上,每个用于群集专用网络的网络适配器都需要一个静态 IP 地址。所使用的静态 IP 地址必须与公用网络的静态 IP 地址不在同一个子网或网络上。建议您分别使用 10.10.10.10 和 10.10.10.11(子网掩码为 255.255.255.0)作为这两个节点的专用 IP 地址。如果公用网络使用 10.x.x.x 网络和 255.255.255.0 子网掩码,建议您使用备用专用网络 IP 地址和子网掩码。如果配置了多个专用网络,则每个专用网络适配器和网络都需要唯一的地址和子网。

  • 公用地址 在每个节点上,每个用于群集公用网络的网络适配器都需要一个静态 IP 地址。另外,服务器群集和群集邮箱服务器也需要静态 IP 地址,以便客户端和管理员能够访问它们。所使用的静态 IP 地址必须与专用网络的静态 IP 地址不在同一个子网或网络上。

群集中所有节点的专用网络必须处于同一个子网上,但是可以对两个节点之间的互连使用 VLAN 交换机。如果使用 VLAN,则点到点的往返延迟必须少于 0.5 秒。此外,从节点上运行的 Windows Server 2003 操作系统的角度来看,两个节点之间的链接必须显示为单个点到点连接。为了避免单点故障,对节点之间的不同路径使用独立的 VLAN 硬件。相同的子网限制不会应用于 Windows Server 2008 上运行的故障转移群集。

群集中所有节点所用的公用网络必须位于同一子网上,而且使用的子网必须与专用网络使用的子网不同。相同的子网限制不会应用于 Windows Server 2008 上运行的故障转移群集。

必须配置 Windows 中的群集网络连接顺序,以便公用网络位于连接顺序列表的顶部,而且必须配置群集中的网络优先级,使专用网络列出在优先级顺序的顶部。

如果要在多数据中心配置中安装 Windows Server 2003 的 CCR:

  • 用于客户端访问的所有网络必须提供充足的带宽以及足够短的延迟,以使客户端能够从任一数据中心访问群集邮箱服务器。

  • 用于复制事务日志的所有网络必须提供充足的带宽以及足够短的延迟以及时复制日志文件,以便尽可能不囤积日志文件。

  • 用于群集检测信号的网络必须能够在要求的已配置重试次数内发送和接收检测信号数据包。如果您要在 Windows Server 2003 的 SP2 或 Windows Server 2003 的 SP1 上安装 CCR 并安装来自知识库文章 921181(用于向基于 Windows Server 2003 Service Pack 1 的服务器群集添加文件共享见证功能和可配置群集检测信号功能的更新已推出)的修补程序,则丢失的界面检测信号重试次数和丢失的节点检测信号重试次数会显示为群集配置属性。如果您要在 Windows Server 2008 上安装 CCR,则不需要此更新。在任一种情况下,检测信号仍会每隔 1.2 秒就发送一次,但可配置该群集以便在采取任何恢复操作之前必须发生更多丢失(无论是因为丢弃的数据包、过多的延迟、接口故障,还是因为节点故障)。属性值以丢失的检测信号为单位,而不是以经过的时间为单位。因此,群集不能配置为怀疑在五秒之后将发生接口故障。它可配置为怀疑在发生五次丢失之后将发生接口故障,而五次丢失大致为五秒到六秒(取决于在检测信号期间内实际发生故障的时间)。这些设置所允许的最小值为 2 秒,最大值为 20 秒。

针对 CCR 优化 Windows 2003 网络

在 Windows Server 2003 上使用 CCR 时,建议您根据特定网络链接的速度和延迟优化 Windows Server TCP/IP 设置。具体地说,可能需要在主动和被动节点上调整传输控制协议 (TCP) 接收窗口大小和 Request for Comments (RFC) 1323 窗口缩放选项。此外,最好配置地址解析协议 (ARP) 缓存过期设置,并在 Windows 注册表中禁用 Windows Server 2003 可伸缩网络包 (SNP) 的高级 TCP/IP 选项。

除了这些建议以外,如果在您的环境中使用了 IP 安全 (IPsec) 协议,建议您在整个 CCR 环境中一致地配置 IPsec。即,两个节点都使用 IPsec,或两个节点都不使用 IPsec。如果仅将一个节点配置为使用 IPsec,则 IPsec 安全关联过程可能会导致数据包延迟或数据包丢失。

TCP 接收窗口和 RFC 1323 缩放选项

TCP 接收窗口大小是一次用一个连接可以接收的最大数据量(字节)。发送计算机在等待从接收计算机返回确认和 TCP 窗口更新之前,只能发送最大数量的数据。最好调整此设置,以便提高日志传送期间的吞吐量。

若要优化 TCP 吞吐量,发送计算机应当传输足够多的数据包,以填充发送方和接收方之间的管道。网络管道的容量基于管道的带宽及其延迟(往返时间)。延迟越长,则网络管道的容量越大,这是因为将有更多的时间用于在两次确认之间发送数据。通过增加 TCP 窗口大小,系统可以通过发送更多数据来利用两次确认之间的时间。


TCP/IP 标准允许的接收窗口大小高达 65,535 字节,这是可以在 16 位 TCP 窗口大小字段中指定的最大值。若要在高带宽、高延迟的网络上提高性能,通过使用 RFC 1323“TCP Extensions for High Performance”中所述的可缩放窗口,Windows Server TCP/IP 支持通告接收窗口大小大于 65,535 字节的能力。使用窗口缩放时,会话中的主机可以协商允许多个大型数据包(例如那些在文件传输协议中经常使用的数据包)在接收方缓冲区中挂起的窗口大小。RFC 1323 详细说明了一种方法,这种方法通过允许 TCP 在建立连接时协商窗口大小的缩放系数,来支持更大的接收窗口大小。

通过修改下面两个注册表项,可以在运行 Windows Server 2003 的计算机上优化 TCP 接收窗口大小和 RFC 1323 窗口缩放选项:TCPWindowSizeTCP1323Opts。有关这些功能的详细信息,请参阅 Microsoft 知识库文章 224829 描述 Windows 2000 和 Windows Server 2003 TCP 功能

建议您使用 Exchange 2007 邮箱服务器角色存储要求计算器的版本 13 或更高版本,根据网络链接和网络延迟来确定这些注册表项的最佳设置。可以从 Exchange 团队博客的此位置下载计算器。存储计算器还包括在服务器上输入注册表值的逐步说明。

note注意:
UNRESOLVED_TOKEN_VAL(exBlog) 

ARP 缓存过期

ARP 缓存是将 IP 地址映射到媒体访问控制 (MAC) 地址的内存中的表。每次出站数据包被发送到条目中的 IP 地址时,就会引用 ARP 缓存中的条目。默认情况下,Windows Server 2003 自动调整 ARP 缓存的大小,以满足系统的需要。如果在连续两分钟内某个条目未被任何传出数据报使用,则从 ARP 缓存中删除该条目。所引用的条目则在十分钟后从 ARP 缓存中删除。手动添加的条目不会自动从缓存中删除。

由 Microsoft 内部 IT 部门进行的内部测试表明,在 CCR 和 SCR 环境中默认 ARP 缓存过期设置会导致数据包丢失。当发生数据包丢失时,发送服务器必须重新传输丢失的数据。在连续复制环境中,请务必尽快将日志文件复制到被动节点,因丢失数据包而重新传输数据会对日志传送吞吐量造成负面影响。

可以在 Windows 注册表中修改 ArpCacheMinReferencedLife TCP/IP 参数,以控制 ARP 缓存过期。此参数确定了所引用的条目在被删除之前必须在 ARP 缓存表中保留多长时间。在内部,Microsoft 发现 ArpCacheMinReferencedLife 注册表值的最佳设置与网络上路由器所用的 ARP 缓存过期值相等,该值是 4 小时。

在自己的环境中修改 ArpCacheMinReferencedLife 值之前,建议您使用 Microsoft 网络监视器或类似的捕获工具,来收集和分析用于将日志从主动节点复制到被动节点的网络接口上的网络流量。有关修改 ArpCacheMinReferencedLife 注册表值的详细步骤,请参阅 Appendix A:TCP/IP Configuration Parameters

可缩放网络包的高级 TCP/IP 功能

Windows Server 2003 可缩放网络包 (SNP) 是 Windows Server 2003 的单独更新,其中包含有状态和无状态减负功能以便对 Windows 网络堆栈加速。该更新包括 TCP Chimney 减负、接收端缩放 (RSS) 和网络直接内存访问 (NetDMA)。

TCP Chimney 是有状态减负。通过 TCP Chimney 减负,可以将 TCP/IP 处理中的一些负载转移到可以在硬件中进行 TCP/IP 处理的网络适配器。

RSS 和 NetDMA 是无状态减负。如果一台计算机中有多个 CPU,Windows 网络堆栈会将“接收”协议的处理限定到一个 CPU。RSS 解决此问题的方法是,将从网络适配器接收的数据包平均分摊到多个 CPU 上。NetDMA 允许在外围组件互连 (PCI) 总线上使用直接内存访问 (DMA) 引擎。TCP/IP 堆栈可以使用 DMA 引擎复制数据,而不是中断 CPU 来处理复制操作。相关的组件 TCPA 是另一个减负功能,此时可以使用 PCI 总线上的硬件 DMA 引擎来协助进行接收处理。

在一些环境中这些功能可以提供网络性能优势;但在某些情况下,由于使用了其他技术而不能使用这些功能。例如,如果使用了以下任一技术,则不能使用 TCP Chimney 减负和 NetDMA:

  • Windows 防火墙

  • Internet 协议安全 (IPsec)

  • Internet 协议网络地址转换 (IPNAT)

  • 第三方防火墙

  • NDIS 5.1 中间驱动程序

此外,一些环境存在已知问题,包括使用 Microsoft Exchange 的环境,在这些环境中使用上述功能时网络性能会降低。有关某些已知问题的详细信息,请参阅 Exchange 团队博客文章 Windows 2003 Scalable Networking pack and its possible effects on Exchange

note注意:
UNRESOLVED_TOKEN_VAL(exBlog)

建议您在运行于 Windows Server 2003 操作系统上的 CCR 环境中,对操作系统和系统中的每个网络接口卡 (NIC) 禁用所有功能。可以按以下方式禁用这些功能:

有关 SNP 的详细信息,请参阅知识库文章 912222 Microsoft Windows Server 2003 可伸缩网络包发行版Scalable Networking网站。

Outlook 在多子网故障转移群集中的群集邮箱服务器进行故障转移之后的行为

在地理位置分散的多子网故障转移群集中部署的 CMS 发生移动或故障转移时,会沿用 CMS 的名称。但不会沿用分配给该名称的 IP 地址。此服务器对客户端及其他服务器的可用性取决于新 IP 地址在整个 DNS 中的传播情况。发生 DNS 传播可能需要一段时间。为此,我们建议将 CMS DNS 主机记录的生存时间 (TTL) 值配置为 5 分钟(300 秒)。有关如何配置 CMS 的 DNS TTL 值的详细步骤,请参阅如何为网络名称资源配置 DNS TTL 值。配置好 CMS 的 DNS TTL 值之后,必须停止 CMS 然后重新启动,以使更改生效。

尽管内部 Microsoft Office Outlook 客户端不需要新的或重新配置的配置文件即可使用新的 IP 地址进行连接,但仍然需要等待清除其本地 DNS 高速缓存,以便 CMS 名称的名称解析从旧的 IP 地址移至新的 IP 地址。IP 地址传播到适当的 DNS 服务器后,可以通过在 Outlook 客户端上的命令提示符下运行以下命令来清除该客户端上的 DNS 缓存:

ipconfig /flushdns

下列各部分将介绍 Outlook 在不同配置中的行为。

Windows Server 2003 上扩展的 CCR(一个子网)

在此配置中,有一个网络名称资源以及一个与该网络名称资源相关的 IP 地址资源。在 DNS 中,网络名称与 IP 地址关联。所有资源(包括 IP 地址资源)均可在群集中的两个节点之间移动。从 Outlook 角度来看,由于只有故障转移时的网络更改才与计算机 MAC 地址的 IP 地址关联(这对于客户端来说是透明的),因此 IP 地址不会更改。

Windows Server 2008 上扩展的 CCR(假设使用 IPv4,且有两个子网)

在此配置中,有一个网络资源名称以及两个与网络名称相关的 IP 地址,这两个 IP 地址之间的逻辑关系为“OR”。在 DNS 中,网络名称与当前处于联机状态的 IP 地址关联。在故障转移过程中,当网络名称资源联机时,群集服务将使用与另一个子网相对应的第二个 IP 地址来更新网络名称的 DNS 条目。记录更新必须在整个 DNS 中传播。从 Outlook 角度来看,Outlook 不需要新的或重新配置的配置文件,但必须等待本地 DNS 缓存刷新,才可支持将网络名称解析为其他 IP 地址。通过运行以下命令,可以在客户端上手动执行此操作:

IPConfig /flushdns

远程站点中带 SCR 的本地 CCR(一个子网或两个子网)

在此配置中,有一个网络名称资源以及一个与该网络名称相关的 IP 地址资源。所有资源(包括 IP 地址)均可在群集中的 2 个节点之间移动。在站点故障转移过程中,通过运行 Setup.com /recoverCMS 激活 SCR 目标时,CMS 将移到其他站点/群集。运行此命令后,您应提供与远程站点中的网络名称关联的 IP 地址。安装程序可创建网络名称资源和 IP 地址资源,且群集服务将使用新的 IP 地址更新 DNS。DNS 更新必须在整个 DNS 中传播。从 Outlook 角度来看,Outlook 不需要新的或重新配置的配置文件,但必须等待本地 DNS 缓存刷新,才可支持将网络名称解析为其他 IP 地址。通过运行以下命令,可以在客户端上手动执行此操作:

IPConfig /flushdns

群集连续复制的存储要求

通过 CCR 可以不再需要 Windows 群集中的共享存储。共享存储是以前版本的 Exchange 的要求。CCR 唯一的存储要求是 Windows 支持的存储可提供足够的性能和容量。

CCR 不会为存储组和数据库使用的存储增加其他 I/O 注意事项。在设计 CCR 存储解决方案时,建议您按照下列最佳实践操作:

  • 存储组和数据库的位置在所有群集节点上必须相同。

  • 将数据库文件和事务日志文件存储在不同的逻辑单元号 (LUN) 上。

  • 使用 NTFS 文件系统卷装入点向操作系统展现卷。

  • 使用可识别名称,可以直接并明显地绑定到托管的存储组或数据库。如果日志和数据库使用不同的卷,则路径应标识数据类型。此方法有助于避免因为数据库数和存储组数的增加而造成人为错误。如果执行默认安装,则将在 Exchange 2007 的安装位置创建存储组和数据库。

    note注意:
    Exchange 2007 不支持将事务日志或数据库文件放在卷的根目录。

CCR 环境需要可提供足够性能和容量的存储。应在两个节点上,使用相同的位置(驱动器号和路径)为每个存储组和数据库配置对系统的性能和容量而言等同的存储。

数据库大小和群集连续复制

对于使用 CCR 时会发生的灾难性的存储故障或物理数据库损坏,第一道防线就是还原到数据的被动副本并且不从备份进行还原。这使拥有基于从存档或磁带进行还原的较短恢复时间目标 (RTO) 的重要性大大降低。激活了数据库的被动副本(而不是从磁带进行还原)后,这些数据会在数分钟内(而不是数小时内)即可供客户端使用。在这种意义上说,CCR 可被认为是一种快速的恢复机制,可归入与使用 Exchange Server 2003 中的卷影复制服务 (VSS) 创建的基于硬件的快照和克隆相同的类别。

对于管理员而言,由于进行了不良备份(例如,磁带已损坏或还原失败)而必须执行脱机数据库操作(如修复)是不常见的。使用 CCR 时,就可以避免这种情况,并且必须针对数据库运行修复的可能性会大大降低。虽然发生必须进行修复的情况的百分比应显著降低,但是,有些时候仍然必须要进行修复。请确保在决定数据库大小时考虑您对最坏情况下停机时间的容忍程度。

使用 CCR,可以拥有更长的联机维护时间。因为 CCR 允许您基于存储组的被动副本生成备份,所以您可以在主动群集节点上拥有更长的联机维护时间。在许多情况下,您可使联机维护窗口扩展一倍,从而使您拥有更大的邮箱和数据库。

Exchange 2007 的另一个功能(称为丢失日志回弹 (LLR))可显著减少由于丢失日志而导致的数据库不一致情况的发生。通常,管理员修复某个数据库的最常见的原因是,要在所需日志已丢失或损坏(从而阻止了数据库装入)的情况下使该数据库处于一致状态。LLR 为许多丢失和损坏日志的情况提供了回弹机制,从而使数据库可在不必运行修复的情况下被装入。有关 LLR 的详细信息,请参阅 Exchange 2007 中的丢失日志回弹和事务日志活动

此时,看上去似乎连续复制可使您随心所欲地增大数据库而不会产生风险。但是,这不是事实。对于每个数据库而言,应在合理的时间量内完成的联机维护仍然是数据库大小的限制因素。但是,使用 CCR 时,需要将数据库重新设定为种子的可能性也是一个限制因素。CCR 提供了数据库冗余,以便在数据库的主动副本已丢失或损坏时,可以通过激活数据库的被动副本来快速完成恢复。CCR 通过称为“故障转移”的过程提供了自动激活。

发生故障转移之后,仍然只会保持数据库的一个副本 - 新的主动副本。由于被动副本已不再存在,因此数据库回弹可能会出现问题。但是,您应该还有备份。若要再次启用复原,需要将丢失或损坏的数据库删除,并需要创建数据库的新被动副本并从主动副本将该新副本重新设定为种子。这可能需要很长时间,具体取决于数据库的大小。最坏情况就是丢失或损坏了所有主动副本,在此情况下,必须将所有被动副本重新设定为种子。这种情况是我们建议对 CCR 环境使用 Gigabit 以太网的原因之一。

在 CCR 环境中,在没有磁盘或处理器瓶颈的 Gigabit 以太网上应可以看到下列速率:

  • 单个数据库重新设定种子:大约 25 MB/秒

  • 多个数据库重新设定种子(并行):大约 100 MB/秒(受网络带宽限制)

使用连续复制时可以使用更大的最大数据库大小。建议 Exchange 2007 使用以下最大数据库大小:

  • 不使用连续复制时邮箱服务器上驻留的数据库:100 GB

  • 使用连续复制和 Gigabit 以太网时邮箱服务器上驻留的数据库:200 GB

    note注意:
    大型数据库可能还需要较新的存储技术以提供更高的带宽来满足修复方案的要求。
    important要点:
    数据库实际的最大大小应由您的组织已有的服务级别协议 (SLA) 决定。确定可在组织的 SLA 中指定的时间段内备份和还原的最大大小的数据库,就是确定数据库最大大小的方法。

群集连续复制的 Active Directory 要求

CCR 具有独立服务器的所有 Active Directory 基础结构要求,同时还具有其他要求。在多数据中心解决方案中,因为任何数据中心随时可能会驻留群集邮箱服务器,所以两个数据中心必须均具有足够的 Active Directory 基础结构支持。即使其他数据中心不可用,也需要具有此容量。此外,群集中的所有节点必须处于同一个域中,群集服务帐户必须拥有适当的权限。

note注意:
对于地理上分散的群集,因为群集中的所有节点都必须是同一站点的成员,因此群集中的邮箱服务器要求单个 Active Directory 网站在数据中心之间扩展。但是,不要求两个数据中心中的任何其他服务器位于同一子网或同一 Active Directory 网站中。

群集连续复制的服务帐户要求

如果您要在 Windows Server 2008 上安装 CCR,则群集服务帐户必须在 LocalSystem (SYSTEM) 帐户下运行。

如果您要在 Windows Server 2003 上安装 CCR,则必须使用域帐户作为群集服务帐户。群集中的所有节点都必须是同一域的成员,并且群集中的所有节点都必须使用相同的群集服务帐户。群集服务帐户还必须是能够驻留群集邮箱服务器的每个节点上的本地 Administrators 组的成员。

在故障转移群集的网络名称资源处于联机状态时,群集服务帐户负责创建和维护由该资源标识并与之关联的计算机帐户。若要确保群集服务帐户具有相应的权限,请参阅知识库文章 307532 当群集服务帐户修改计算机对象时如何解决其故障。知识库文章 251335 域用户无法将工作站或服务器加入到域中中提供了其他信息。

群集连续复制和公用文件夹数据库

CCR 和公用文件夹复制是内置到 Exchange 中的两种非常不同的复制形式。由于连续复制和公用文件夹复制之间的互操作性限制,如果 Exchange 组织中的多个邮箱服务器具有公用文件夹数据库,而且启用了公用文件夹复制,则不应将公用文件夹数据库驻留在 CCR 环境中。

以下是在 Exchange 组织中使用公用文件夹数据库和 CCR 的建议配置:

  • 如果 Exchange 组织中只有一个邮箱服务器,并且该邮箱服务器是 CCR 环境中的群集邮箱服务器,则此邮箱服务器可以驻留公用文件夹数据库。在此配置中,Exchange 组织中只有一个公用文件夹数据库。因此,禁用公用文件夹复制。在这种情况下,可以使用 CCR 实现公用文件夹数据库冗余;CCR 可维护公用文件夹数据库的两个副本。

  • 如果您有多个邮箱服务器,则可以在 CCR 环境中驻留公用文件夹数据库,前提是在整个 Exchange 组织中只有一个公用文件夹数据库。在这种情况下,也可以使用 CCR 实现公用文件夹数据库冗余。在此配置中,Exchange 组织中只有一个公用文件夹数据库。因此,禁用公用文件夹复制。

  • 如果要将公用文件夹数据迁移到 CCR 环境中,可以使用公用文件夹复制,将公用文件夹数据库的内容从独立邮箱服务器或 SCC 中的群集邮箱服务器移动到 CCR 环境中的群集邮箱服务器。在 CCR 环境中创建公用文件夹数据库后,其他公用文件夹数据库仅应在您的公用文件夹数据完全复制到 CCR 环境之前存在。复制成功完成后,应该删除 CCR 环境外的所有公用文件夹数据库,且不应在 Exchange 组织中驻留任何其他公用文件夹数据库。

  • 如果要将公用文件夹数据迁移到 CCR 环境之外,可以使用公用文件夹复制,将公用文件夹数据库的内容从 CCR 环境中的群集邮箱服务器移动到独立邮箱服务器或 SCC 中的群集邮箱服务器。在 CCR 环境之外创建其他公用文件夹数据库后,CCR 环境中的公用文件夹数据库应仅在您的公用文件夹数据完全复制到其他公用文件夹数据库之前存在。复制成功完成后,应该删除所有 CCR 环境内的所有公用文件夹数据库,且不应将所有后续公用文件夹数据库驻留在为连续复制启用的存储组中。

Exchange 组织中存在多个公用文件夹数据库,且一个或多个公用文件夹数据库驻留在 CCR 环境中(如前面所述的迁移方案)的任何期间内,请考虑计划中断(不丢失数据)和未计划的中断(丢失数据)的行为差异:

  • 如果发生成功的计划中断(不丢失数据),则公用文件夹数据库将联机,并且公用文件夹复制应按预期继续进行。

  • 如果发生未计划的中断,则要等到原始服务器以及驻留公用文件夹数据库的存储组的所有日志都可用后,公用文件夹数据库才会联机。如果由于中断造成数据丢失,则 CCR 将不允许公用文件夹数据库在启用公用文件夹复制时联机。在这种情况下,必须使原始节点联机才能确保数据不会丢失,或者必须在 CCR 环境中的群集邮箱服务器上重新创建公用文件夹数据库,且必须使用公用文件夹复制从 CCR 环境之外的公用文件夹数据库恢复其内容。

备份和还原以及群集连续复制

使用 VSS 技术的生产存储组和数据库以及复制存储组和数据库都支持 Exchange 感知备份。仅支持从主动节点上进行流式备份。

note注意:
Exchange 感知备份期间的一项常见任务是,在备份成功完成之后截断事务日志文件。CCR 中的复制功能可以确保尚未复制的日志不会被删除。此行为意味着在某个删除日志的模式下运行备份时,如果在日志复制足够晚的阶段运行复制,则实际上不可能释放空间。

对主动副本进行的 Exchange 感知还原可以使用流式备份解决方案或 VSS 备份解决方案完成。被动副本不支持 Exchange 感知还原。

note注意:
执行还原之前,应当从被动存储组副本中删除所有存储组和数据库文件。

利用备份将数据库还原到 CCR 环境中的存储组后,必须分别使用 Suspend-StorageGroupCopyResume-StorageGroupCopy 先暂停再恢复存储组的连续复制。该过程需要使用正确的日志生成信息更新 Microsoft Exchange 复制服务。如果不挂起和恢复连续复制,则 Microsoft Exchange 复制服务将包含过时的日志生成信息,并将停止复制日志文件。

Exchange 2007 SP1 中的联机维护数据库计算校验和及数据库页面清零

计算校验和是检查数据库完整性的过程。页面擦除是流式备份结束时对数据库进行清零操作的过程。采用数据库的联机完全流式备份时,会计算整个数据库的 Exchange 2007 RTM 校验和。如先前所述,在连续复制环境中,仅可以针对数据库的主动副本进行流式备份。无法对数据库的被动副本进行流式备份。VSS 可以用于对被动副本拍摄完全快照或进行完全克隆,且还可以计算完全快照和克隆的校验和。但通常在连续复制环境中,如果没有管理员干预和一定的停机时间,则仅可以计算其中一个数据库副本(主动副本或被动副本)的校验和。这是因为:

  • 对数据库的主动副本进行流式备份是很麻烦的,且对同一数据库的被动副本进行 VSS 备份也很麻烦。

  • 尽管 VSS 既可以用于主动数据库副本也可以用于被动数据库副本,但这样做与从主动副本到被动副本的卸载备份操作的建议相反。

  • 弹性可能会临时存在安全风险,因为使用 Exchange Server 数据库实用程序 (Eseutil) 手动执行完整性检查需要挂起连续复制。

为了在所有数据库副本上启用页面擦除和数据库计算校验和,同时不会遇到或不必解决前面部分所述的问题,Exchange 2007 SP1 引入了两个新功能:“联机维护数据库计算校验和”和“联机维护数据库页面清零”。这些功能使管理员能够打开数据库的后台页面擦除和后台计算校验和。通过在包含要扫描的数据库的邮箱服务器上手动配置注册表值,然后重新启动 Microsoft Exchange 信息存储服务,可以单独启用这两个功能中的任何一个或一前一后启用这两个功能。注册表值是在 Microsoft Exchange 信息存储级上配置的。这样,在启用之后,邮箱服务器上的所有数据库会执行配置的后台活动。在本主题中稍后会介绍可用的注册表项。

Caution警告:
UNRESOLVED_TOKEN_VAL(exRegistry)

启用联机维护数据库计算校验和

位置:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSExchangeIS\ParametersSystem

名称:联机维护校验和

类型:REG_DWORD

值:0x00000001

启用联机维护数据库页面清零

位置:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSExchangeIS\ParametersSystem

名称:在校验和过程中的零数据库页面

类型:REG_DWORD

值:0x00000001

限制联机维护数据库计算校验和

位置:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSExchangeIS\ParametersSystem

名称:限制校验和

类型:REG_DWORD

值:0x00000000(毫秒)