你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 虚拟桌面工作负载的监视注意事项

本文讨论 Azure 虚拟桌面工作负载的监视设计区域。 在开始使用适用于 Azure 虚拟桌面的 Azure Monitor 之前,需要执行以下步骤:

  • 至少配置一个 Log Analytics 工作区。 为 Azure 虚拟桌面会话主机使用指定的 Log Analytics 工作区,以帮助确保仅从 Azure 虚拟桌面部署中的会话主机收集性能计数器和事件。
  • 为 Log Analytics 工作区的以下项启用数据收集:
    • 来自 Azure 虚拟桌面环境的诊断
    • 来自 Azure 虚拟桌面会话主机的建议性能计数器
    • 来自 Azure 虚拟桌面会话主机的建议 Windows 事件日志

以下部分提供了监视 Azure 虚拟桌面环境并使其保持正常运行的注意事项。

重要

本文是 Azure Well-Architected Framework Azure 虚拟桌面工作负载 系列的一部分。 如果不熟悉本系列,建议从什么是 Azure 虚拟桌面工作负载开始。

运行状况和可用性监视

影响:卓越运营、可靠性

Azure 提供多种服务,例如 Azure 服务运行状况和 Azure 资源运行状况,可让你随时了解云资源的运行状况。

服务运行状况

应使用服务运行状况来提供所用 Azure 服务和区域的运行状况视图。 服务运行状况是查找有关影响服务的事件(例如中断和计划内维护活动)的通知的最佳位置。 服务运行状况还提供有关对 Azure 虚拟桌面环境和相关订阅的影响的其他运行状况公告。 最主动的方法是设置服务运行状况警报。 可以通过首选的通信渠道接收这些警报。 当服务问题、计划内维护或其他更改可能影响 Azure 虚拟桌面资源时,警报会通知你。 有关详细信息,请参阅 设置服务警报

资源运行状况

资源运行状况可帮助你诊断并获取对影响 Azure 资源的服务问题的支持。 有关资源的当前和过去运行状况的信息在 资源运行状况 中报告。 请务必设置主动警报,以通知你任何不需要的资源运行状况状态。 可以监视以下资源类型的资源运行状况:

  • 适用于 Azure 虚拟桌面 FSLogix 和应用附加的 Azure 存储解决方案
  • 会话主机或虚拟机 (VM)
建议
  • 使用服务运行状况随时了解所使用的 Azure 服务和区域的运行状况。
  • 设置服务运行状况警报,以便随时了解服务问题、计划内维护或其他可能影响 Azure 虚拟桌面资源的更改。
  • 使用 资源运行状况 监视 VM 和存储解决方案。
  • 设置资源运行状况警报。

性能监视

影响:性能效率、卓越运营

若要获得可见性并监视性能,需要监视 Azure 虚拟桌面环境的关键组件。

配置建议

若要帮助确保从 Azure 虚拟桌面实体检索关键绩效指标和必要的日志,请配置以下要发送到 Log Analytics 的数据诊断:

  • Azure 虚拟桌面主机池日志
  • Azure 虚拟桌面工作区诊断
  • Azure 虚拟桌面应用程序组 诊断
  • 存储诊断
  • 有关来自 Monitor 代理或 Log Analytics 代理的会话主机的数据
  • 根据 Monitor 或 Log Analytics 代理数据收集规则收集的性能和事件日志数据
  • Azure VM 见解数据

配置选项

有几个选项可用于配置诊断设置:

  • Azure 虚拟桌面见解配置工作簿。 Azure 虚拟桌面见解是基于监视工作簿构建的仪表板,可帮助你了解 Azure 虚拟桌面环境。 Azure 虚拟桌面见解提供了一个配置工作簿,可用于:

    • 配置主机池和工作区诊断。
    • 在会话主机上启用监视代理。
    • 配置建议的性能计数器和事件日志,以监视 Azure 虚拟桌面环境。

    可以通过配置 Log Analytics 工作区的代理设置来收集其他关键绩效指标。

  • Azure Policy。 可以使用 Azure Policy 来帮助确保在 VM 上安装监视代理。 Azure Policy支持监视代理和 Microsoft 监视代理。

  • 部署配置和模板。 可以使用 Azure 门户 或声明性部署解决方案(例如 Azure 资源管理器 模板 (ARM 模板) 、BICEP 或 Terraform)来部署 Azure 虚拟桌面。 确保诊断设置部署为 Azure 虚拟桌面部署配置的一部分。 如果通过Azure 门户部署 Azure 虚拟桌面,请确保已启用诊断设置。 对于声明性部署模型,请确保在启用诊断设置的情况下部署主机池、工作区或应用程序组。 此外,请确保使用 Microsoft 监视代理或监视代理扩展部署 VM。

会话主机性能

性能计数器记录系统资源的使用方式。 性能计数器的数据引入取决于你的环境规模和使用情况。 请务必了解每个性能计数器以特定频率发送数据。 在 Azure 虚拟桌面见解配置工作簿中,可以调整每分钟的默认采样率。 还可以在设置中编辑此速率。 应用于此速率的乘数取决于计数器。

以下列表显示了性能指标的类别,以及可在每个类别中配置的性能计数器:

  • 逻辑磁盘
    • Free Space
    • Avg. Disk Queue Length
    • Avg. Disk sec/Transfer
    • Current Disk Queue Length
  • 内存
    • % Committed Bytes in Use
    • Available Mbytes
    • Page Faults/sec
    • Pages/sec
  • 物理磁盘
    • Avg. Disk Queue Length
    • Avg. Disk sec/Read
    • Avg. Disk sec/Transfer
    • Avg. Disk sec/Write
  • 处理器信息
    • % Processor Time
    • RemoteFX network
    • Current TCP RTT
    • Current UDP Bandwidth
    • Terminal Services
    • Active Sessions
    • Inactive Sessions
    • Total Sessions
  • 每个进程的用户输入延迟
    • Max Input Delay
  • 每个会话的用户输入延迟
    • Max Input Delay

可以使用 Log Analytics 中的诊断表来查询和分析 Azure 虚拟桌面连接的网络信息。 数据 WVDConnectionNetworkData 包括映射到特定 Azure 虚拟桌面连接的相关 ID。 对于每个会话,可以看到关键性能数据,例如估计的往返时间(以毫秒为单位)和估计的可用带宽(以 KBps 为单位)。

Windows 事件日志是 Log Analytics 代理在 Windows VM 上收集的数据源。 可以从标准日志(如系统和应用程序日志)收集事件。 还可以从需要监视的应用程序创建的自定义日志中收集事件。 默认情况下,在 Monitor 中为 Azure 虚拟桌面收集以下类型的 Windows 事件的日志:

  • Application
  • Microsoft-Windows-TerminalServices-RemoteConnectionManager/Admin
  • Microsoft-Windows-TerminalServices-LocalSessionManager/Operational
  • System
  • Microsoft-FSLogix-Apps/Operational
  • Microsoft-FSLogix-Apps/Admin

只要在环境中满足事件的条款,就会触发 Windows 事件。 与处于运行不正常状态的计算机相比,处于正常状态的计算机发送的事件更少。

请务必监视事件日志,了解 Azure 虚拟桌面代理可能出现的连接问题。 有关详细信息,请参阅 排查常见的 Azure 虚拟桌面代理问题

存储性能阈值和监视

应监视用于托管 FSLogix 配置文件或应用附加共享的 Azure 存储解决方案。 请务必监视配置文件存储位置,以帮助确保不会超过阈值,这可能会对用户体验产生负面影响。 对于存储,应监视文件共享容量,以帮助确保文件共享配额不会达到最大容量。 还应监视文件共享事务,以帮助确保事务在定义的阈值内。

服务限制

Azure 虚拟桌面具有在部署的设计阶段应考虑的服务限制。 在生产环境中也需要了解这些服务限制,并且应主动报告这些限制。 限制相对较大。 但在大型部署中,在更容易达到这些限制的情况下,监视这些限制至关重要。 有关详细信息,请参阅 Azure 虚拟桌面限制

建议
  • 配置要发送到 Log Analytics 的诊断数据。
  • 从用于配置诊断设置的各种选项中进行选择,例如 Azure 虚拟桌面见解配置工作簿、Azure Policy、Azure 门户或模板。
  • 配置性能计数器,以便记录系统资源的使用方式。
  • 使用 Log Analytics 中的诊断表查询和分析 Azure 虚拟桌面连接的网络信息。
  • 监视 Azure 虚拟桌面代理连接问题的事件日志。
  • 监视用于托管 FSLogix 配置文件或应用附加共享的 Azure 存储解决方案。
  • 监视服务使用情况,确保工作负荷不超过限制。

安全监视

影响:安全性

以下部分介绍为提高工作负载安全性而可以采取的几种监视措施。

Microsoft Defender for Cloud 和 Microsoft Sentinel

确保在部署的订阅和 Azure 虚拟桌面会话主机上启用了 Microsoft Defender for Cloud 增强的安全功能。 Defender for Cloud 提供云工作负载保护平台和云安全态势管理。 可以使用 Defender for Cloud 管理漏洞,并评估支付卡行业 (PCI) 和ISO27001等常见框架的合规性。 还可以使用 Defender for Cloud 来增强环境的整体安全态势。 Defender for Cloud 使用 Microsoft 监视代理或 Monitor 代理。

Microsoft Entra ID身份验证和审核日志

无论客户端使用哪种连接方法,Microsoft Entra ID都是 Azure 虚拟桌面的第一线身份验证解决方案。 因此,收集Microsoft Entra ID身份验证和审核日志非常重要。 可以通过以下方式收集这些日志:

  • 在诊断设置中,将审核日志和登录日志配置为发送到 Log Analytics,可在其中查询数据并发出警报。
  • 使用 Microsoft Sentinel 中的连接器从Microsoft Entra ID收集数据并将其流式传输到 Microsoft Sentinel。

安全事件日志

应从 Azure 虚拟桌面会话主机收集安全事件日志。 最好将这些日志添加到涉及 Azure 虚拟桌面主机的安全事件的集中式存储库。 可以使用存储库来存储和查询日志。 可以使用以下选项之一收集日志:

  • 使用监视代理数据收集规则收集安全事件日志。 建议使用此选项。
  • 使用 Microsoft 监视代理收集 Microsoft Sentinel 的日志,或使用旧版代理连接器收集安全事件。
  • 使用 Microsoft 监视代理收集 Defender for Cloud 的安全事件。

保持合规性

每月安全更新对于 Azure 虚拟桌面环境的整体运行状况和安全性至关重要。 确保通过安装新映像或使用更新管理工具定期更新 Azure 虚拟桌面环境。 最好每月报告一次,并监视环境的整体更新符合性。 这种做法有助于确保 Azure 虚拟桌面管理员和安全团队始终了解环境的总体安全符合性状态。

建议
  • 使用 Defender for Cloud 管理漏洞并评估常见框架的合规性。
  • 使用 Defender for Cloud 增强环境的整体安全态势。
  • 收集Microsoft Entra ID身份验证和审核日志。
  • 将 Azure 虚拟桌面会话主机的安全事件日志存储在存储库中。
  • 定期更新 Azure 虚拟桌面环境。
  • 执行每月合规性报告。

报表

影响:卓越运营

Azure 虚拟桌面报告提供了多个选项:

  • Azure 虚拟桌面见解。 此仪表板提供了许多了解和监视 Azure 虚拟桌面环境所需的见解和可视化效果。
  • 工作簿和外部报告工具。 在某些情况下,使用自定义工作簿和仪表板会很有帮助。 可以使用 Log Analytics 表和 Azure Resource Graph查询结果作为数据源来创建自己的报表或工作簿。 Resource Graph是一项服务,可用于报告 Azure 虚拟桌面对象,例如主机池、工作区、计算组件和存储解决方案。 只有在为 Azure 虚拟桌面对象打开诊断并使用支持的监视代理收集性能和事件日志数据时,才会在自定义解决方案中填充数据。 以下 Log Analytics 表可用作数据源:
    • Azure 虚拟桌面 Log Analytics 表
      • WVDAgentHealthStatus
      • WVDCheckpoints
      • WVDConnectionGraphicsDataPreview
      • WVDConnectionNetworkData
      • WVDConnections
      • WVDErrors
      • WVDFeeds
      • WVDHostRegistrations
      • WVDManagement
    • 性能计数器表
      • Perf
      • InsightMetrics 仅当启用 VM 见解功能时 ()
    • 事件表
      • Event
建议
  • 请考虑使用 Azure 虚拟桌面见解进行报告。
  • 在创建自定义仪表板时,使用 Log Analytics 表和Resource Graph查询结果作为数据源。

警报

影响:性能效率、卓越运营

使用监视警报框架或等效的监视解决方案随时了解 Azure 虚拟桌面的性能和安全性。 可以为以下类型的 Azure 虚拟桌面事件、诊断和资源配置自定义警报:

  • VM 性能
  • 针对会话主机上不可用状态问题的关键事件,例如 ID 为 3702 或 3703 的应用程序事件
  • 服务运行状况
  • 资源运行状况
  • Azure 虚拟桌面诊断数据
  • 配置文件和应用附加包
  • Defender for Cloud
建议
  • 使用警报随时了解 Azure 虚拟桌面的性能和安全性。
  • 为各种 Azure 虚拟桌面事件、诊断和资源配置警报。

后续步骤

现在,你已了解 Azure 虚拟桌面中的可观测性最佳做法,探索可用于进一步保护 Azure 虚拟桌面工作负载的机制、工具和外围。

使用评估工具评估设计选项。