你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure VMware 解决方案私有云和群集概念

Azure VMware 解决方案可在 Azure 中提供基于 VMware 的私有云。 私有云硬件和软件部署可在 Azure 中实现完全集成和自动化。 通过 Azure 门户、CLI 或 PowerShell 部署和管理私有云。

私有云包括具有以下内容的群集:

  • 使用 VMware ESXi 虚拟机监控程序预配的专用裸机服务器主机
  • 用于管理 ESXi 和 vSAN 的 VMware vCenter Server
  • VMware NSX 软件定义的网络,适用于 vSphere 工作负载 VM
  • VMware vSAN 数据存储,适用于 vSphere 工作负荷 VM
  • 用于工作负载移动性的 VMware HCX
  • Azure 底层中的资源(连接和操作私有云所需)

私有云在 Azure 订阅中进行安装和管理。 订阅中的私有云数量是可缩放的。 最初,每个订阅的私有云数限制为一个。 Azure 订阅、Azure VMware 解决方案私有云、vSAN 群集和主机之间存在逻辑关系。

下图描述了 Azure VMware 解决方案的体系结构组件。

说明单个 Azure 订阅中包含用于开发和生产环境的两个私有云的关系图。

每个 Azure VMware 解决方案体系结构组件都具有以下功能:

  • Azure 订阅:为 Azure VMware 解决方案提供受控访问、预算和配额管理。
  • Azure 区域:将数据中心分组为可用性区域 (AZ),然后将 AZ 分组为区域。
  • Azure 资源组:将 Azure 服务和资源放入逻辑组中。
  • Azure VMware 解决方案私有云:使用 VMware 软件提供计算、网络和存储资源,其中包括 vCenter Server、NSX 软件定义网络、vSAN 软件定义存储和 Azure 裸机 ESXi 主机。 还支持 Azure NetApp 文件、Azure 弹性 SAN 和纯云块存储。
  • Azure VMware 解决方案资源群集:通过使用 VMware 软件(包括 vSAN 软件定义存储和 Azure 裸机 ESXi 主机)横向扩展 Azure VMware 解决方案私有云,为客户工作负荷提供计算、网络和存储资源。 还支持 Azure NetApp 文件、Azure 弹性 SAN 和纯云块存储。
  • VMware HCX:提供移动性、迁移和网络扩展服务。
  • VMware Site Recovery:通过 VMware vSphere Replication 自动执行灾难恢复和存储复制服务。 还支持第三方灾难恢复解决方案 Zerto Disaster Recovery 和 JetStream Software Disaster Recovery。
  • 专用 Microsoft Enterprise Edge (D-MSEE):连接 Azure 云和 Azure VMware 解决方案私有云实例的路由器。
  • Azure 虚拟网络 (VNet):将 Azure 服务和资源连接在一起。
  • Azure 路由服务器:与 Azure 网络交换动态路由信息。
  • Azure 虚拟网络网关:使用 IPSec VPN、ExpressRoute 和 VNet 到 VNet 将 Azure 服务和资源连接到其他专用网络。
  • Azure ExpressRoute:在 Azure 数据中心与本地或场地租用基础结构之间提供高速专用连接。
  • Azure 虚拟 WAN (vWAN):将网络、安全和路由功能组合到单个统一的广域网 (WAN) 中。

主机

Azure VMware 解决方案群集基于超融合基础结构。 下表显示了主机的 CPU、内存、磁盘和网络规格。

主机类型 CPU(核心数/GHz) RAM (GB) vSAN 缓存层(TB,原始) vSAN 容量层(TB,原始) 区域可用性
AV36 双 Intel Xeon Gold 6140 CPU(Skylake 微架构),每个 CPU 有 18 个 2.3 GHz 核心,总共 36 个物理核心(使用超线程可以实现 72 个逻辑核心) 576 3.2 (NVMe) 15.20 (SSD) 选定的区域 (*)
AV36P 双 Intel Xeon Gold 6240 CPU(Cascade Lake CPU 微架构),18 核/CPU 采用 2.6 GHz/3.9 GHz Turbo,总共 36 个物理核心(72 个逻辑核心,超线程) 768 1.5(Intel 缓存) 19.20 (NVMe) 选定的区域 (*)
AV52 双 Intel Xeon Platinum 8270 CPU(Cascade Lake CPU 微架构),26 核/CPU 采用 2.7 GHz/4.0 GHz Turbo,总共 52 个物理核心(104 个逻辑核心,超线程) 1,536 1.5(Intel 缓存) 38.40 (NVMe) 选定的区域 (*)
AV64 双 Intel Xeon Platinum 8370C CPU(Ice Lake 微架构),每个 CPU 32 个核心,采用 2.8 GHz/3.5 GHz Turbo,总计 64 个物理核心(使用超线程可实现 128 个逻辑核心) 1,024 3.84 (NVMe) 15.36 (NVMe) 选定的区域 (**)

一个 Azure VMware 解决方案群集需要至少三个主机。 只能在单个 Azure VMware 解决方案私有云中使用相同类型的主机。 用于生成或缩放群集的主机来自独立的主机池。 这些主机已通过硬件测试,并已安全删除所有数据,然后再添加到群集中。

上述所有主机类型具有 100 Gbps 网络接口吞吐量。

(*) 可通过 Azure 定价计算器获取的详细信息。

(**) AV64 先决条件:在添加 AV64 之前,需要使用 AV36、AV36P 或 AV52 部署的 Azure VMware 解决方案私有云。

Azure 区域可用性区域 (AZ) 到 SKU 映射表

规划 Azure VMware 解决方案设计时,请通过下表了解 Azure 区域的每个物理可用性区域中提供的 SKU。

重要

若要将私有云放置在靠近 Azure 原生工作负荷(包括 Azure NetApp 文件和纯云块存储 (CBS) 等集成服务)的位置,则此映射很重要。

下表中还标记了 Azure VMware 解决方案拉伸群集的多 AZ 功能。 Azure VMware 解决方案的客户配额由 Azure 区域分配,你无法在私有云预配期间指定可用性区域。 自动选择算法用于平衡 Azure 区域中的部署。 如果你想要部署到特定的可用性区域,请向 Microsoft 提出服务请求,请求针对你的订阅、Azure 区域、可用性区域和 SKU 类型的“特殊放置策略”。 在你请求删除或更改此策略之前,此策略将一直有效。

由于客户的占用,以粗体标记的 SKU 的可用性受限,该配额在请求时可能不可用

Azure 区域 可用性区域 SKU 多 AZ SDDC
澳大利亚东部 AZ01 AV36P
澳大利亚东部 AZ02 AV36
澳大利亚东部 AZ03 AV36P
澳大利亚东南部 AZ01 AV36
Brazil South AZ02 AV36
加拿大中部 AZ02 AV36、AV36P
加拿大东部 空值 AV36
美国中部 AZ01 AV36P
美国中部 AZ02 AV36
美国中部 AZ03 AV36P
东亚 AZ01 AV36
美国东部 AZ01 AV36P
美国东部 AZ02 AV36P
美国东部 AZ03 AV36、AV36P、AV64
美国东部 2 AZ01 AV36、AV64
美国东部 2 AZ02 AV36P、AV52、AV64
法国中部 AZ01 AV36
德国中西部 AZ01 AV36P
德国中西部 AZ02 AV36
德国中西部 AZ03 AV36、AV36P
日本东部 AZ02 AV36
日本西部 AZ01 AV36
美国中北部 AZ01 AV36
美国中北部 AZ02 AV36P
北欧 AZ02 AV36、AV64
卡塔尔中部 AZ03 AV36P
南非北部 AZ03 AV36
美国中南部 AZ01 AV36、AV64
美国中南部 AZ02 AV36P、AV52、AV64
东南亚 AZ02 AV36
瑞典中部 AZ01 AV36
瑞士北部 AZ01 AV36、AV64
瑞士西部 AZ01 AV36、AV64
英国南部 AZ01 AV36、AV36P、AV52、AV64
英国南部 AZ02 AV36、AV64
英国南部 AZ03 AV36P、AV64
英国西部 AZ01 AV36
西欧 AZ01 AV36、AV36P、AV52
西欧 AZ02 AV36
西欧 AZ03 AV36P、AV64
美国西部 AZ01 AV36、AV36P
美国西部 2 AZ01 AV36
美国西部 2 AZ02 AV36P
美国西部 3 AZ01 AV36P
US Gov 亚利桑那州 AZ02 AV36P
US Gov 弗吉尼亚州 AZ03 AV36

群集

默认情况下,对于创建的每个私有云,均有一个 vSAN 群集。 可添加、删除和缩放群集。 每个群集和初始部署的最小主机数为三个。

可以使用 vCenter 服务器和 NSX-T Manager 来管理群集配置和操作的大多数方面。 群集中每个主机的所有本地存储都受 VMware vSAN 控制。

Azure VMware 解决方案管理和控制平面具有以下资源要求,在对标准私有云进行解决方案大小调整时需要考虑这些资源要求。

区域 描述 预配的 vCPU 数 预配的 vRAM (GB) 预配的 vDisk (GB) 典型 CPU 使用率 (GHz) 典型 vRAM 使用率 (GB) 典型的原始 vSAN 数据存储使用率 (GB)
VMware vSphere vCenter Server 8 28 915 1.1 3.9 1,854
VMware vSphere vSphere 群集服务 VM 1 1 0.1 2 0.1 0.1 5
VMware vSphere vSphere 群集服务 VM 2 1 0.1 2 0.1 0.1 5
VMware vSphere vSphere 群集服务 VM 3 1 0.1 2 0.1 0.1 5
VMware vSphere ESXi 节点 1 不可用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 2 不可用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 3 不可用 不可用 空值 5.1 0.2 不可用
VMware vSAN vSAN 系统使用情况 不适用 不可用 不可用 不可用 空值 5,458
VMware NSX-T 数据中心 NSX-T 统一设备节点 1 12 48 300 2.5 13.5 613
VMware NSX-T 数据中心 NSX-T 统一设备节点 2 12 48 300 2.5 13.5 613
VMware NSX-T 数据中心 NSX-T 统一设备节点 3 12 48 300 2.5 13.5 613
VMware NSX-T 数据中心 NSX-T 边缘 VM 1 8 32 200 1.3 0.6 409
VMware NSX-T 数据中心 NSX-T 边缘 VM 2 8 32 200 1.3 0.6 409
VMware HCX(可选加载项) HCX 管理器 4 12 65 1 2.5 140
VMware Site Recovery Manager(可选加载项) SRM 设备 4 12 33 1 1 79
VMware vSphere(可选加载项) vSphere 复制管理器设备 4 8 33 1 0.6 75
VMware vSphere(可选加载项) vSphere 复制服务器设备 2 1 33 1 0.3 68
总计 77 个 vCPU 269.3 GB 2,385 GB 30 GHz 50.4 GB 10,346 GB(9,032 GB,预期的数据缩减率为 1.2 倍)

Azure VMware 解决方案管理和控制平面具有以下资源要求,在对拉伸群集私有云进行解决方案大小调整时需要将这些资源要求考虑在内。 VMware SRM 未包含在表中,因为它当前不受支持。

区域 描述 预配的 vCPU 数 预配的 vRAM (GB) 预配的 vDisk (GB) 典型 CPU 使用率 (GHz) 典型 vRAM 使用率 (GB) 典型的原始 vSAN 数据存储使用率 (GB)
VMware vSphere vCenter Server 8 28 915 1.1 3.9 3,708
VMware vSphere vSphere 群集服务 VM 1 1 0.1 2 0.1 0.1 5
VMware vSphere vSphere 群集服务 VM 2 1 0.1 2 0.1 0.1 5
VMware vSphere vSphere 群集服务 VM 3 1 0.1 2 0.1 0.1 5
VMware vSphere ESXi 节点 1 不可用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 2 不可用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 3 不可用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 4 不适用 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 5 空值 不可用 空值 5.1 0.2 不可用
VMware vSphere ESXi 节点 6 空值 不可用 空值 5.1 0.2 不可用
VMware vSAN vSAN 系统使用情况 不适用 不可用 不可用 不可用 不适用 10,722
VMware NSX-T 数据中心 NSX-T 统一设备节点 1 12 48 300 2.5 13.5 1,229
VMware NSX-T 数据中心 NSX-T 统一设备节点 2 12 48 300 2.5 13.5 1,229
VMware NSX-T 数据中心 NSX-T 统一设备节点 3 12 48 300 2.5 13.5 1,229
VMware NSX-T 数据中心 NSX-T 边缘 VM 1 8 32 200 1.3 0.6 817
VMware NSX-T 数据中心 NSX-T 边缘 VM 2 8 32 200 1.3 0.6 817
VMware HCX(可选加载项) HCX 管理器 4 12 65 1 2.5 270
总计 67 个 vCPU 248.3 GB 2,286 GB 42.3 GHz 49.1 GB 20,036 GB(17,173 GB,预期的数据缩减率为 1.2 倍)

这些资源要求仅适用于 Azure VMware 解决方案私有云中部署的第一个群集。 后续群集只需在确定解决方案大小时考虑 vSphere 群集服务、ESXi 资源要求和 vSAN 系统使用情况。

虚拟设备的“典型原始 vSAN 数据存储使用情况”值占虚拟机文件占用的空间,包括配置和日志文件、快照、虚拟磁盘和交换文件。

VMware ESXi 节点的计算使用率值考虑了 vSphere VMkernel 虚拟机监控程序开销、vSAN 开销以及 NSX-T 分布式路由器、防火墙和桥接开销。 这些是对标准三群集配置的估计。 存储要求列为不适用 (N/A),因为使用了独立于 vSAN 数据存储的引导卷。

VMware vSAN 系统使用情况存储开销包括 vSAN 性能管理对象、vSAN 文件系统开销、vSAN 校验和开销以及 vSAN 重复数据删除和压缩开销。 要查看此消耗量,请在 vSphere 客户端中选择 vSphere 群集的监视器、vSAN 容量对象。

VMware HCX 和 VMware Site Recovery 管理器资源要求是 Azure VMware 解决方案服务的可选加载项。 如果不使用这些要求,请在解决方案大小调整中忽略这些要求。

VMware Site Recovery Manager 加载项具有配置多个 VMware vSphere Server 复制设备的选项。 上表假定使用一台 vSphere 复制服务器设备。

调整 Azure VMware 解决方案的大小是一个估计;设计阶段的大小调整计算应在项目的测试阶段进行验证,以确保针对应用程序工作负载正确调整 Azure VMware 解决方案大小。

提示

如果你的需要超出初始部署数目,以后可以随时扩展群集和添加其他群集。

下表介绍了 Azure VMware 解决方案的最大限制。

资源 限制
每个私有云的 vSphere 群集数 12
每个群集的最小 ESXi 主机数 3(硬限制)
每个群集的最大 ESXi 主机数 16(硬限制)
每个私有云的最大 ESXi 主机数 96
每个私有云的最大 vCenter Server 数 1(硬限制)
最大 HCX 站点配对数 25(任何版本)
最大 HCX 服务网格数 10(任何版本)
从单个位置到单个虚拟网络网关的 Azure VMware 解决方案 ExpressRoute 链接私有云数上限 4
使用的虚拟网络网关确定实际最大链接私有云数。 有关更多信息,请参阅关于 ExpressRoute 虚拟网关
如果超过此阈值,请使用 Azure VMware 解决方案互连来聚合 Azure 区域中的私有云连接。
Azure VMware 解决方案 ExpressRoute 端口最大速度 10 Gbps(使用已启用 FastPath 的超高性能网关 SKU)
使用的虚拟网络网关决定了实际带宽。 有关更多信息,请参阅关于 ExpressRoute 虚拟网关
分配给 NSX-T 数据中心的 Azure 公共 IPv4 地址的最大数目 2,000
每个私有云的最大 Azure VMware 解决方案互连数 10
每个 Azure VMware 解决方案私有云的最大 Azure ExpressRoute Global Reach 连接数 8
vSAN 容量限制 75% 的总可用容量(保留 25% 用于 SLA)
VMware Site Recovery Manager - 受保护虚拟机的最大数目 3,000
VMware Site Recovery Manager - 每个恢复计划的虚拟机的最大数目 2,000
VMware Site Recovery Manager - 每个恢复计划的保护组的最大数目 250
VMware Site Recovery Manager - RPO 值 5 分钟或更长时间 *(硬限制)
VMware Site Recovery Manager - 每个保护组的虚拟机的最大数目 500
VMware Site Recovery Manager - 恢复计划的最大数目 250

* 有关恢复点目标 (RPO) 低于 15 分钟的信息,请参阅《VSphere 复制管理指南》中的 5 分钟恢复点目标的工作原理

有关其他 VMware 特定的限制,请使用 VMware 配置最大值工具

VMware 软件版本

Microsoft 是 VMware 裸机即服务 (MaaS) 计划的成员,使用 VMware Cloud Provider Stack (VCPS) 进行 Azure VMware 解决方案升级规划。

新部署的 Azure VMware 解决方案私有云中使用的 VMware 解决方案软件版本包括:

软件 版本
VMware vCenter Server 7.0 U3o
VMware ESXi 7.0 U3oTianfuCup HotPatch
VMware vSAN 7.0 U3
VMware vSAN 磁盘格式 15
VMware vSAN 存储体系结构 OSA
VMware NSX 4.1.1
VMware HCX 4.7.0
VMware Site Recovery Manager 8.7.0.3
VMware vSphere 复制 8.7.0.3

当前运行的软件版本将应用于添加到现有私有云的新群集中。

主机维护和生命周期管理

Azure VMware 解决方案私有云的一个优点是可以为你维护平台。 Microsoft 负责管理 VMware 软件(ESXi、vCenter Server 和 vSAN)和 NSX-T Data Center 设备的生命周期。 Microsoft 还负责启动网络配置,如创建第 0 层网关和启用北-南路由。 你负责 NSX-T Data Center SDN 配置:网段、分布式防火墙规则、第 1 层网关和负载均衡器。

注意

创建了 T0 网关,并将其配置为私有云部署的一部分。 对该逻辑路由器或 NSX-T Data Center 边缘节点 VM 的任何修改都可能会影响与私有云的连接,因此应该避免。

Microsoft 负责将任何补丁、更新或升级应用到私有云中的 ESXi、vCenter Server、vSAN 和 NSX-T Data Center。 补丁、更新和升级对 ESXi、vCenter Server 和 NSX-T Data Center 的影响有以下注意事项:

  • ESXi - 私有云中运行的工作负载不会受到影响。 在此期间不会阻止对 vCenter Server 和 NSX-T Data Center 的访问。 建议在这段时间内不要在私有云中规划其他活动,例如:纵向扩展私有云、计划或发起有效的 HCX 迁移、进行 HCX 配置更改,等等。

  • vCenter Server - 私有云中运行的工作负载不会受到影响。 在此期间,vCenter Server 不可用,你无法管理 VM(停止、启动、创建或删除)。 建议不要规划其他活动,例如纵向扩展私有云、创建新网络,等等。 建议在使用 VMware Site Recovery Manager 或 vSphere Replication 用户界面时不要执行以下任何操作:在 vCenter Server 升级期间配置 vSphere Replication,以及配置或执行站点恢复计划。

  • NSX-T Data Center - 工作负荷受到影响。 升级特定主机时,该主机上的 VM 可能会失去连接,时间从 2 秒到 1 分钟不等,并出现下列任意症状:

    • Ping 错误

    • 数据包丢失

    • 错误消息(例如,目标主机无法访问以及 Net 无法访问)

    在此升级窗口期间,会阻止对 NSX-T Data Center 管理平面的所有访问。 在该时段内,无法对 NSX-T Data Center 环境进行配置更改。 工作负荷会继续正常运行,具体取决于此前详细介绍的升级影响。

    建议在升级时间段内不要在私有云中计划其他活动,例如纵向扩展私有云等。 其他活动可能会阻止开始升级,或者可能会对升级和环境产生不利影响。

你可以通过 Azure 服务运行状况获得通知,其中包括升级时间线。 该通知还提供了有关升级的组件及其对工作负载、私有云访问和其他 Azure 服务的影响的详细信息。 如有需要,可以重新计划升级。

软件更新包括:

  • 补丁 - VMware 发布的安全补丁或 bug 修补程序

  • 更新 - VMware 堆栈组件的次要版本更改

  • 升级 - VMware 堆栈组件的主要版本更改

注意

Microsoft 可以在 VMware 发布关键安全补丁后立即对其进行测试。

在部署下一个计划的更新之前,将会实施有文档记录的 VMware 解决方法,而不是安装相应的补丁。

主机监视和修正

Azure VMware 解决方案可持续监视 VMware 组件和底层的运行状况。 当 Azure VMware 解决方案检测到故障时,其将采取措施来修复出现故障的组件。 当 Azure VMware 解决方案在 Azure VMware 解决方案节点上检测到性能下降或故障时,其将触发主机修正进程。

主机修正涉及到将错误节点替换为群集中新的健康节点。 然后,如有可能,故障主机会处于 VMware vSphere 维护模式。 VMware vMotion 会将 VM 从故障主机移到群集中的其他可用服务器上,这可能会导致工作负载的实时迁移出现零停机时间这一情况。 如果故障主机无法处于维护模式,则主机将从群集中删除。 在故障主机被移除之前,客户工作负荷会迁移到新添加的主机上。

提示

客户沟通:在开始更换之前以及更换成功后,系统会向客户的电子邮件地址发送一封电子邮件。

在被添加到订阅中的以下任何 Azure RBAC 角色之前,你不能接收与主机更换相关的电子邮件:“服务管理员”、“共同管理员”、“所有者”、“参与者”。

Azure VMware 解决方案将监视主机上的以下情况:

  • 处理器状态
  • 内存状态
  • 连接和电源状态
  • 硬件风扇状态
  • 网络连接丢失
  • 硬件系统板状态
  • vSAN 主机上的磁盘出现错误
  • 硬件电压
  • 硬件温度状态
  • 硬件电源状态
  • 存储状态
  • 连接失败

注意

Azure VMware 解决方案租户管理员不得编辑或删除此前定义的 VMware vCenter Server 警报,因为这些警报由 vCenter Server 上的 Azure VMware 解决方案控制平面进行管理。 Azure VMware 解决方案监视可使用这些警报来触发 Azure VMware 解决方案主机修正进程。

备份和还原

Azure VMware 解决方案私有云 vCenter Server、NSX 和 HCX Manager(如果启用)配置按每日备份计划进行。 在 Azure 门户中创建支持请求以请求还原。

注意

还原仅适用于灾难性情况。

Azure VMware 解决方案可持续监视物理底层和 VMware 解决方案组件的运行状况。 当 Azure VMware 解决方案检测到故障时,其将采取措施来修复出现故障的组件。

后续步骤

现在,你已了解 Azure VMware 解决方案私有云概念,建议你了解以下内容: