你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
配置 Azure VMware 解决方案 vSAN 上的 Windows Server 故障转移群集
本文介绍如何使用本机共享磁盘配置 Azure VMware 解决方案 vSAN 上的 Windows Server 故障转移群集。
Windows Server 故障转移群集(WSFC,以前称为 Microsoft 服务群集服务 (MSCS))是一种 Windows Server 操作系统 (OS) 功能。 WSFC 是一项业务关键型功能,许多应用程序都需要此功能。 例如,以下配置都需要 WSFC:
- SQL Server 的配置如下:
- Always On 故障转移群集实例,用于实现实例级高可用性。
- Always On 可用性组 (AG),用于实现数据库级高可用性。
- Windows 文件服务:
- 在活动群集节点上运行的一般文件共享。
- 横向扩展文件服务器 (SOFS),用于将文件存储在群集共享卷 (CSV) 中。
- 存储空间直通 (S2D);用于在不同的群集节点中创建存储池的本地磁盘。
你可以将 WSFC 群集托管在不同的 Azure VMware 解决方案实例上,此配置称为 Cluster-Across-Box (CAB)。 也可以将 WSFC 群集放置在单个 Azure VMware 解决方案节点上。 此配置称为 Cluster-in-a-Box (CIB)。 不建议将 CIB 解决方案用于生产实现,而应将 CAB 与放置策略配合使用。 如果单个 Azure VMware 解决方案节点发生故障,所有 WSFC 群集节点都将关闭电源,并且应用程序将会出现停机。 Azure VMware 解决方案要求私有云群集中至少有三个节点。
一定要部署受支持的 WSFC 配置。 你的解决方案需要在 VMware vSphere 和 Azure VMware 解决方案中受支持。 有关 vSphere 7.0 上的 WSFC 的详细信息,请参阅 VMware 提供的文档设置故障转移群集和 Microsoft 群集服务。
本文重点介绍了 Windows Server 2016 和 Windows Server 2019 上的 WSFC。 遗憾的是,较早的 Windows Server 版本不在主要支持范围内,因此本文中不探讨这些版本。
首先,需要创建 WSFC。 随后使用本文中的信息在 Azure VMware 解决方案上指定 WSFC 部署。
先决条件
- Azure VMware 解决方案环境
- Microsoft Windows Server 操作系统安装介质
参考体系结构
Azure VMware 解决方案为虚拟化 WSFC 提供本机支持。 它在虚拟磁盘级别支持 SCSI-3 永久保留 (SCSI3PR)。 WSFC 需要通过此支持来仲裁节点之间对共享磁盘的访问。 通过 SCSI3PR 支持,可以在 vSAN 数据存储上以本机方式配置使用 VM 间共享的磁盘资源的 WSFC。
下图说明了 Azure VMware 解决方案私有云上 WSFC 虚拟节点的体系结构。 它显示了 Azure VMware 解决方案的驻留位置(就更广泛的 Azure 平台而言),其中包括 WSFC 虚拟服务器(蓝框)。 此图展示了一个典型的中心辐射型体系结构,但使用 Azure 虚拟 WAN 也可以实现类似设置。 两种设置都可以提供其他 Azure 服务能带给你的所有价值。
支持的配置
目前支持的配置包括:
Microsoft Windows Server 2012 或更高版本
每个 WSFC 实例最多可有五个节点 (VM)
每个 VM 最多四个 PVSCSI 适配器
每个 PVSCSI 适配器最多 64 个磁盘
虚拟机配置要求
WSFC 节点配置参数
- 在每个 WSFC 节点上安装最新的 VMware 工具。
- 不支持在单个虚拟 SCSI 适配器上混合使用非共享磁盘和共享磁盘。 例如,如果系统磁盘(驱动器 C:)连接到 SCSI0:0,则第一个共享磁盘会连接到 SCSI1:0。 WSFC 的 VM 节点可拥有的虚拟 SCSI 控制器数量上限与普通 VM 相同 - 最多拥有四 (4) 个虚拟 SCSI 控制器。
- 虚拟光盘 SCSI ID 应在托管同一个 WSFC 的节点的所有 VM 之间保持一致。
组件 | 要求 |
---|---|
VM 硬件版本 | 版本 11 或更高版本,以支持实时 vMotion。 |
虚拟 NIC | VMXNET3 半虚拟化网络接口卡 (NIC);在虚拟 NIC 上启用来宾内置 Windows 接收方缩放 (RSS)。 |
内存 | 将整个 VM 预留内存用于 WSFC 群集中的节点。 |
增加每个 WSFC 节点的 I/O 超时时间。 | 将 HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Disk\TimeOutValueSet 修改为 60 秒或更大值。 (如果重新创建群集,此值可能会重置为其默认值,因此必须再次更改它。) |
Windows 群集运行状况监视 | 必须将 Windows 群集运行状况监视的 SameSubnetThreshold 参数的值修改为至少允许丢失 10 个检测信号。 这是 Windows Server 2016 中的默认设置。 此建议适用于使用 WSFC 的所有应用程序,其中包括共享磁盘和非共享磁盘。 |
WSFC 节点 - 启动磁盘配置参数
组件 | 要求 |
---|---|
SCSI 控制器类型 | LSI 逻辑 SAS |
磁盘模式 | 虚拟 |
SCSI 总线共享 | 无 |
修改托管启动设备的虚拟 SCSI 控制器的高级设置。 | 向每个 WSFC 节点添加以下高级设置: scsiX.returnNoConnectDuringAPD = "TRUE" scsiX.returnBusyOnNoConnectStatus = "FALSE" 其中 X 是启动设备 SCSI 总线控制器 ID 编号。 默认情况下,X 设置为 0。 |
WSFC 节点 - 共享磁盘配置参数
组件 | 要求 |
---|---|
SCSI 控制器类型 | VMware 半虚拟化 (PVSCSI) |
磁盘模式 | 独立 - 永久性(请参阅下图中的步骤 2)。 使用此设置,可确保从快照中排除所有磁盘。 基于 WSFC 的 VM 不支持快照。 |
SCSI 总线共享 | 物理(请参阅下图中的步骤 1) |
多编写器标志 | 未使用 |
磁盘格式 | 复杂预配(vSAN 不要求使用厚置备置零 (EZT)) |
不支持的方案
Azure VMware 解决方案上的 WSFC 不支持以下功能:
- NFS 数据存储
- 存储空间
- 使用 iSCSI 服务的 vSAN
- vSAN 拉伸群集
- 增强的 vMotion 兼容性 (EVC)
- vSphere 容错 (FT)
- 快照
- 实时(在线)存储 vMotion
- N 端口 ID 虚拟化 (NPIV)
对虚拟机硬件进行的热更改可能会中断 WSFC 节点之间的检测信号。
以下活动不受支持,它们可能会导致 WSFC 节点故障转移:
- 热添加内存
- 热添加 CPU
- 使用快照
- 增加共享磁盘的大小
- 暂停和恢复虚拟机状态
- 内存过度配置会导致 ESXi 交换或 VM 内存扩展
- 热扩展本地 VMDK 文件(即使该文件未与 SCSI 总线共享控制器关联)
在 Azure VMware 解决方案 vSAN 上为 WSFC 配置共享磁盘
确保 Active Directory 环境可用。
在 vSAN 数据存储上创建虚拟机 (VM)。
开启所有 VM,配置主机名和 IP 地址,将所有 VM 加入 Active Directory 域,并安装最新的操作系统更新。
安装最新的 VMware 工具。
在每个 VM 上启用并配置 Windows Server 故障转移群集功能。
配置群集仲裁见证(可以是文件共享见证)。
关闭 WSFC 群集所有节点的电源。
将一个或多个半虚拟 SCSI 控制器(最多四个)添加到 WSFC 的每个 VM 中。 使用前面段落中的设置。
在第一个群集节点上,通过“添加新设备”>“硬盘”添加所需的所有共享磁盘。 将磁盘共享保留为“未指定”(默认),磁盘模式应保留为“独立 - 永久性”。 然后将共享磁盘附加到在前面步骤中创建的控制器。
在剩余的 WSFC 节点上继续操作。 通过选择“添加新设备”>“现有硬盘”,添加在上一个步骤中创建的磁盘。 请务必在所有 WSFC 节点上保留相同的磁盘 SCSI ID。
开启第一个 WSFC 节点,登录并打开磁盘管理控制台 (mmc)。 确保已添加的共享磁盘可以由操作系统进行管理并已初始化。 设置磁盘的格式并分配一个驱动器号。
开启其他 WSFC 节点。
通过“添加磁盘”向导将磁盘添加到 WSFC 群集中,并将它们添加到群集共享卷。
通过“移动磁盘”向导测试故障转移,并确保使用共享磁盘的 WSFC 群集正常工作。
运行“验证群集”向导,确认群集及其节点是否正常工作。
一定要注意群集验证测试中的以下特定项目:
验证存储空间永久保留。 如果你的集群没有使用存储空间(以 Azure VMware 解决方案 vSAN 为例),则此测试不适用。 可以忽略“验证存储空间永久保留”测试的任何结果,包括此警告。 若要避免出现警告,可以排除此测试。
验证网络通信。 群集验证测试会显示一条警告,指出每个群集节点都只有一个网络接口可用。 你可以忽略此警告。 Azure VMware 解决方案会提供所需的可用性和性能,因为节点连接到其中一个 NSX-T Data Center 段。 但是,请将此项保留为群集验证测试的一部分,因为它会验证网络通信的其他方面。
根据 WSFC CIB 或 CAB 配置,创建相关放置策略以将 WSFC VM 放置在正确的 Azure VMware 解决方案节点上。 为此,你需要创建一个主机到 VM 的关联规则。 这样,群集节点将分别在相同或不同的 Azure VMware 解决方案主机上运行。
相关信息
- Windows Server 中的故障转移群集
- vSphere 上的 Microsoft 群集准则 (1037959) (vmware.com)
- 设置故障转移群集和 Microsoft 群集服务的相关知识 (vmware.com)
- vSAN 6.7 U3 - 使用共享磁盘的 WSFC 和 SCSI-3 永久预留 (vmware.com)
- Azure VMware 解决方案限制
后续步骤
了解如何在 Azure VMware 解决方案中设置 WSFC 后,接下来详细了解以下内容:
- 通过添加需要 WSFC 功能的更多应用程序来设置新的 WSFC。 例如,SQL Server 和 SAP ASCS。
- 设置备份解决方案。