Azure Stack HCI 可观测性

适用于:Azure Stack HCI 版本 23H2

本文介绍 Azure Stack HCI 中的可观测性以及实现该可观测性的数据源。

什么是 Azure Stack HCI 可观测性?

Azure Stack HCI 可观测性是指监视和了解 Azure Stack HCI 系统的行为的能力。

Azure Stack HCI 中的可观测性非常重要,因为它可以从系统收集遥测和诊断信息。 此信息可帮助 Microsoft 获取对系统行为的宝贵见解,这些行为可用于识别和修复潜在问题。

Azure Stack HCI 中的可观测性是通过以下数据源实现的:

  • 遥测。 这包括遥测和诊断信息的收集,可帮助 Microsoft 获取对系统行为的宝贵见解。 请参阅 遥测

  • 远程支持。 这允许支持工程师获取对群集的只读远程访问,以便进行第一步修正。 请参阅 远程支持

  • 诊断。 这包括收集诊断日志的功能。 请参阅 诊断

    描述 Azure Stack HCI 可观测性的三种数据源类型的示意图。

如何安装可观测性?

可观测性和远程支持作为 Azure Stack HCI 部署过程的一部分进行安装。 这允许 业务流程协调程序 自动执行部署过程中涉及的许多步骤。 目标是提供一个简单的设置过程,用于处理所有组件,包括可观测性。

什么是可观测性管道?

可观测性管道使用遥测、诊断和监视从设备收集数据。 它将 Azure 的可观测性资产扩展到这些设备,同时保持在由于客户所有权、地理位置和这些设备的操作而施加的合规性和安全约束范围内。

可观测性管道划分为以下广泛区域:

  • 遥测。 遥测部分提供从 Azure Stack HCI 到 Azure 的特选关键事件的连续流。

  • 诊断。 诊断部分提供从 Azure Stack HCI 到 Azure 的偶发或按需数据流。

  • 监视。 监视部分提供从 Azure Stack HCI 到 Azure 的特选指标的连续流。 数据到达 Azure 后,会将其用于产品生命周期的不同方面,例如产品开发、客户支持、案例偏差和趋势分析。

下图描绘了从 Azure Stack HCI 到 Azure 的可观测性管道和数据流:

描述 Azure Stack HCI 可观测性管道中的组件的示意图。

遥测

Azure Stack HCI 中的遥测是指收集有关系统性能、功能和整体运行情况的数据。 此数据是通过遥测和诊断扩展收集的,该扩展支持从客户环境收集遥测和诊断信息。 请参阅 Azure Stack HCI 遥测和诊断扩展

遥测对于 Azure Stack HCI 非常重要,因为它使 Microsoft 能够深入了解系统的行为。 此信息可用于改进产品、解决问题以及为客户提供更好的支持。 遥测数据还可用于主动识别和缓解潜在问题,降低停机或其他中断的可能性。 此外,遥测数据可以帮助 Microsoft 了解客户如何使用 Azure Stack HCI,从而为产品的未来开发和改进提供信息。

远程支持

可使用远程支持,让 Microsoft 支持专业人员通过允许远程访问设备并执行有限的故障排除和修复,来更快地解决支持案例。 有关如何获取远程支持的说明,请参阅 获取 Azure Stack HCI 的远程支持

有关 Azure Stack HCI 群集预部署或预注册期间的远程支持,请参阅 获取远程支持

诊断

Azure Stack HCI 中的诊断有助于识别和排查系统中可能出现的问题。 借助诊断,管理员可以监视其 Azure Stack HCI 环境的性能和运行状况,并采取主动措施防止出现问题。 此外,诊断可以提供对系统行为的宝贵见解,这有助于优化其性能并改善整体用户体验。

比较日志收集方法

下表提供了 Azure Stack HCI 中不同日志收集方法的比较:

日志收集方法 目的 如何收集日志 用例
按需日志收集 手动收集 Azure Stack HCI 的诊断日志并将其发送给 Microsoft。 使用 Send-DiagnosticData 任何 Azure Stack HCI 服务器节点中的 cmdlet。

日志暂时在本地复制、分析、发送,然后删除。

有关如何执行按需日志收集的详细说明,请参阅 收集日志
- 非注册失败。
- 基于未结案例从Microsoft 支持部门收集日志请求。
- 注册并连接群集时的日志收集。
- 安装可观测性组件并正常运行时进行日志收集。
- 部分注册群集时的日志收集。
独立日志收集 如果未部署可观测性组件或在群集注册过程中出现问题,请将诊断数据发送给 Microsoft。 在本地保存数据并使用 Send-AzStackHciDiagnosticData 命令将数据发送到 Microsoft。

有关独立日志收集的详细说明,请参阅 执行独立日志收集
- 部署失败。
- 注册失败。
- 基于未结案例从Microsoft 支持部门收集日志请求。
- 群集未注册且没有连接时的日志收集。
- 部分注册群集时的日志收集。
- 当可观测性组件不可用时,日志收集。

数据隐私

Azure Stack HCI 实施数据治理过程,以确保客户数据的安全性和预期使用。 客户有权访问控件以随时自定义功能和调整隐私设置。

我们对数据安全的承诺包括:

  • 确定客户安全和隐私注意事项的优先级。
  • 让客户了解收集的数据类型及其使用方式。
  • 为客户提供更改其自己的隐私设置的自主权。
  • 使用客户数据改善客户体验。

Microsoft 如何使用数据

客户数据可帮助 Microsoft 更好地了解客户如何使用功能和服务来实现其业务目标。 这些见解有助于在可能影响客户体验的领域确定工程投资的优先级。 客户使用网络或存储设置及其更新状态是所收集的数据类型的一些示例。 这些见解还推动了对 Azure Stack HCI 监视和支持生态系统的改进。 这些改进最终将使 Microsoft 支持和客户能够更轻松、更快地进行问题诊断。

数据收集和驻留

Azure Stack HCI 数据:

  • 在产品注册到 Azure 之前,不会发送给 Microsoft。 取消注册 Azure Stack HCI 时,该数据收集将停止。 所有数据都记录到 Azure Stack HCI 分析服务。
  • 路由到受保护的云存储位置。
  • 只有有合法业务理由查看数据的 Microsoft 员工才能访问。 所有数据都根据 Microsoft 隐私策略进行处理。

有关收集的数据的详细信息

下表描述了数据类型、其存储位置、默认设置和查看方法:

数据类型 说明 数据存储位置 默认设置 保留期 如何查看数据
遥测 遥测数据包括性能指标、使用模式以及与用户行为和系统运行状况相关的其他信息。 它不包含任何个人身份信息。 遥测数据始终存储在美国。 它默认为启用状态。 若要更改默认设置,请参阅遥测和诊断设置 数据最多保留两年。 可以在 \\<NodeName>\c$\GMACache\TelemetryCache\Tables/*.tsf 中查看数据。
诊断 诊断数据可帮助 Microsoft 检测、诊断和修复问题,以还原服务运行状况并改进产品。 诊断数据存储在全局或欧盟,具体取决于客户的部署选择。 存在各种方法来传输诊断数据。 有关详细信息,请参阅 诊断 通常保留 30 天,对于正在进行的支持问题,可能会更长的时间。 可以查看每个节点的 C:\observability 文件夹中的数据。
指标 指标是定期收集的数值,用于描述系统的各个方面。 指标数据将发送到部署资源的相应区域。 默认启用,可随时禁用。 平台指标存储 93 天,但是,你只能在“指标”磁贴) 查询任何单个图表上最多 30 天的数据 (。 可以使用指标资源管理器以交互方式分析指标数据库中的数据。
计费和人口普查 计费和人口普查数据有助于可视化和计费Azure 门户中的资源。 计费和人口普查数据将发送到客户注册设备的相应资源区域。 始终启用且不能禁用,因为它被视为正常运行。 删除资源时会删除数据,但保留的计费数据除外。 可以在Azure 门户中查看数据。

后续步骤