你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure VMware 解决方案企业级方案的管理和监视

正确的管理和监视对于 Azure VMware 解决方案的成功至关重要。 此企业级方案概述了关于环境设计的重要建议。 可在 Azure 企业级登陆区域的管理和监视中查看更多指导。

重要

平台监视是 Azure VMware 服务的一部分,监视工作负荷或应用程序、主机内存、计算或存储、vCenter、NSX-Manager NSX Edge VM 和 vSAN 或其他数据存储利用率等组件的利用率是客户响应的一部分。 虽然 Azure VMware 确实提供了下面提供的一些现式见解和示例,但强烈建议客户在本地利用现有的监视或日志记录平台,并尽可能扩展到此类产品的云版本,以确保关键工作负荷的不间断操作。

在为 Azure VMware 解决方案规划管理和监视环境时,了解共担责任矩阵至关重要。 该矩阵显示 Microsoft 负责哪些组件,以及你负责管理和监视哪些组件。 Microsoft 负责云资源的持续维护、安全和管理,让公司负责最重要的事情,例如来宾 OS 配置、应用程序和虚拟机。

重要

要支持 Azure VMware 解决方案,请务必遵循以下建议来配置服务运行状况警报。

平台管理和监视

查看以下有关 Azure VMware 解决方案的平台管理和监视的注意事项

Azure 工具注意事项

  • 针对运营团队最重视的指标创建警报和仪表板。 有关可用的监视和警报指标,请参阅为 Azure VMware 解决方案配置警报GitHub 上提供示例监视仪表板。
  • vSAN 存储是一种有限资源,需要对其进行管理以保持可用性和性能。 请熟悉 Azure VMware 解决方案存储概念。 仅将 vSAN 存储用于来宾虚拟机 (VM) 工作负载。 查看以下设计注意事项,以减少 vSAN 上不必要的存储消耗。
  • 活动日志提供在 Azure 中执行的操作的记录。 这些操作包括创建、更新、删除和特殊操作,如列出凭证或密钥。 例如,每当有人访问 Azure 门户中的“身份”选项卡或以编程方式请求 cloudadmin 凭据时,Azure VMware 解决方案都会发出 List PrivateClouds AdminCredentials。 可将警报规则配置为在记录特定活动时发送通知。
  • Azure VMware 解决方案使用本地标识提供者。 部署后,使用单个管理用户帐户完成 Azure VMware 解决方案初始配置。 将 Azure VMware 解决方案与 Active Directory 集成,以实现用户操作的可跟踪性。 查看来自登陆区域的标识部分的指南。

VMware 工具注意事项

  • 请考虑通过 vRealize Operations Manager 和 vRealize Network Insights 等 VMware 解决方案详细了解 Azure VMware 解决方案平台。 客户可以查看 NSX-T 数据中心分布式防火墙的监视数据,例如 vCenter Server 事件和流日志。
  • vRealize Operations 中可用的指标记录在 VMware 的 vRealize Operations 文档中。
  • Azure VMware 解决方案的 vRealize 日志见解目前支持拉取日志记录。 只能捕获事件、任务和警报。 目前不支持从主机向 vRealize 推送非结构化数据的 Syslog。 不支持 SNMP 陷阱。
  • 虽然 Microsoft 监视 vSAN 的运行状况,但可以利用 vCenter Server 查询和监视 vSAN 的性能。 可以从 VM 或后端的角度查看性能指标,显示通过 vCenter 的平均延迟、IOPS、吞吐量和未完成的 IO。
  • 可以使用 Azure 私有云资源中的诊断设置将 vCenter Server 日志发送到存储帐户或事件中心。 日志设置不能直接在 vCenter Server 中配置,只能通过 Azure 中的私有云资源进行配置。 配置 VMware syslog 文档中提供了详细信息。 输出是原始 syslog,因此请在启用之前考虑保留和下游处理。
  • vRealize Operations 不支持使用 VMware 工具进行来宾内存收集。 正在使用和已使用的内存将继续工作。

来宾工作负载管理注意事项

  • 默认情况下,Azure VMware 解决方案中的虚拟机与本地 VMware vSphere VM 相同。 可以通过现有代理继续在 AVS 中使用现有的 VM 级别监视。
  • Azure VMware 解决方案 VM 不会显示在 Azure 门户中,除非将 Azure Arc for Servers 部署到这些 VM。 使用 Azure Arc for Servers,可以从 Azure 控制平面使用基于代理的方法进行 VM 管理和监视。 可以应用 Azure Policy 来宾配置,使用 Microsoft Defender 保护服务器,并将 Azure Monitor 代理部署到来宾 VM。

设计建议

查看以下有关 Azure VMware 解决方案的平台管理和监视的建议

Azure 工具建议

  • 配置 Azure 服务运行状况以发送警报(针对服务问题、计划内维护以及可能影响 Azure VMware 解决方案和其他服务的其他事件)。 这些通知将发送到操作组,操作组可用于向所选地址发送电子邮件、短信、推送通知和语音呼叫。 操作还可触发 Azure 和第三方系统,包括 Azure Functions、逻辑应用、自动化 Runbook、事件中心和 Webhook。

  • 通过 Azure Monitor 指标监视 Azure VMware 解决方案基础结构的基线性能。 这些指标可以从 Azure 门户查询和筛选,通过 REST API 查询,或者定向到 Log Analytics、Azure 存储、事件中心或合作伙伴集成

  • 配置以下 Azure Monitor 中的警报,以在群集接近磁盘、CPU 或 RAM 使用率的危险值时发出警告:

    指标 警报
    磁盘 - 已使用的数据存储磁盘百分比 (%) >70% 警告
    磁盘 - 已使用的数据存储磁盘百分比 (%) >75% 严重
    CPU - CPU 百分比 (%) >80% 警告
    内存 - 内存使用率平均值 (%) >80% 警告
  • 可以自动创建 Azure Monitor 警报Azure 服务运行状况警报

  • 出于服务级别协议 (SLA) 目的,Azure VMware 解决方案要求 vSAN 上具有 25% 的可用闲置空间。

  • 出于 SLA 目的,Azure VMware 解决方案要求具有 3 到 5 个主机的群集的故障数为 tolerate = 1,而具有 6 到 16 个主机的群集的故障数为 tolerate = 2。 完整的 SLA 记录在以下服务水平协议中。

  • 在混合环境中,可以使用连接监视器来监视本地资源和 Azure 资源之间的通信。

  • Azure 网络观察程序中配置两个连接监视器,以监视连接。

    • 配置连接监视器以查看网络连接在Azure VMware 解决方案(包括 ExpressRoute Direct 和 ExpressRoute Global Reach 连接)中的网络连接的可用性和性能。
  • 将日志发送到 Log Analytics。 有关详细信息,请参阅 将日志发送到 Log Analytics

VMware 工具建议

来宾工作负载管理建议

查看以下有关 Azure VMware 解决方案中运行的来宾工作负载的管理和监视的建议。

  • 在工作负载迁移期间,使用“本地监视”模型以最大限度地减少迁移期间的更改。 迁移之后,请考虑使用 Azure Arc for Servers 通过 Azure 原生解决方案来实现对 Azure VMware 解决方案托管工作负载的管理和监视。

  • 默认存储策略使用复杂预配。 为有效使用 vSAN 容量,请使用 VM 精简预配进行评估。 每个 VM 的磁盘配置可能会有所不同。 一台 VM 可以具有复杂磁盘和/或精简磁盘,具体取决于工作负载的要求。

  • 请按照适用于 Windows 和 Linux 的混合指南为 VM 配置来宾监视。 针对以下 Azure 集成,以这种方式配置 Windows 和 Linux:

    集成 说明
    Log Analytics 用于聚合、查询和以交互方式分析 Azure 资源生成的日志的主要工具。
    Microsoft Defender for Cloud 统一的基础结构安全管理系统,可跨混合和 Azure 资源提供高级威胁防护,从而增强安全态势。
    Microsoft Sentinel 云原生安全信息和事件管理解决方案。 此 Azure 资源跨本地和云环境提供安全分析、警报检测和自动威胁响应。
    Azure 更新管理 为本地和云环境中的 Windows 和 Linux 计算机管理操作系统更新。
    Azure Monitor 一个全面的监视解决方案,用于从云和本地环境收集、分析和处理遥测数据。

存储注意事项

若要根据 CPU 和内存要求帮助解决需要比 vSAN 更多的存储容量的存储密集型工作负荷,请考虑使用 Azure NetApp 文档 将存储占用空间扩展到 Azure 本机存储服务。

Azure VMware 解决方案支持附加网络文件系统 (NFS) 数据存储作为持久存储选项。 可以使用 Azure NetApp 文件卷创建 NFS 数据存储,并将其附加到所选群集。 通过使用 Azure NetApp 文档 支持的 NFS 数据存储,可以扩展存储,而不是缩放群集。 还可以使用Azure NetApp 文档卷将数据从本地或主要 VMware 环境副本 (replica)到辅助站点。

有关详细信息,请阅读Azure VMware 解决方案的Azure NetApp 文档数据存储。

其他注意事项

  • 如果使用网络虚拟设备,请考虑监视本地和 Azure 资源之间的跟踪日志。 确保在 Azure 和 Azure VMware 解决方案之间进行监视。

后续步骤

了解有关 Azure VMware 解决方案企业级方案的业务连续性和灾难恢复的设计注意事项。