你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 运营商关系可观测性

运营商关系可观测性框架提供了对本地实例的操作见解。 该框架支持针对操作(平台和工作负载)数据和指标的日志记录、监视和警报 (LMA)、以及分析和可视化。

运营商关系日志记录、监视和警报 (LMA) 框架的屏幕截图。

图:运营商关系日志记录、监视和警报 (LMA) 框架

运营商关系可观测性框架的主要亮点包括:

  • 集中数据收集:运营商关系可观测性解决方案基于在一个集中位置收集所有数据。 在此位置,可以观察来自所有本地实例的监视数据。
  • 定义完善且经过测试的工具:解决方案依赖于 Azure Monitor 来收集、分析和处理来自云实例和本地实例的遥测数据。
  • 易于学习和使用:借助此解决方案,可以从所有云实例和本地实例或跨这些实例搜索数据,从而轻松分析和调试问题。
  • 可视化工具:根据需要创建自定义仪表板和工作簿。
  • 集成警报工具:基于自定义阈值创建警报。 你可以跨所有实例创建和重复使用警报模板。

本文可帮助你了解运营商关系可观测性框架,该框架由一系列组件构成:

  • Azure Monitor 从运营商关系组件收集日志记录数据并将其聚合在一起
  • Azure Log Analytics 工作区 (LAW) 从多个 Azure 订阅和租户收集日志记录数据并将其聚合在一起
  • 对聚合日志数据执行分析、可视化和警报。

平台监视

通过运营商关系,可了解包含基础结构资源的部署的性能。 需要从这些平台资源收集日志和指标并对它们进行分析。 与分散的数据相比,可以从来自所有源的集中收集和聚合数据中获得有价值的见解。

这些日志和指标用于观察平台的状态。 你可以查看性能并分析问题所在。 可以分析导致造成此情况的原因。 可视化效果有助于配置所需的警报和警报发生的条件。 例如,可以将警报配置为在资源行为异常时或达到阈值时生成警报。 可以使用收集到的日志和分析来调试环境中的任何问题。

监视数据

借助运营商关系可观测性,可收集与其他 Azure 资源相同的数据类型。 可以在 LAW 中查看从每个实例收集的数据。

可以在此处了解如何监视 Azure 资源。

收集和路由

借助运营商关系可观测性,可以为每个基础结构资源收集数据。 基础结构组件集包括:

  • 网络结构,其中包括 CE、TOR、NPB、管理交换机和终端服务器。
  • 计算,其中包括裸机服务器。
  • Undercloud 控制平面(负责部署和管理整个平台生命周期的 Kubernetes 群集)。

默认情况下,在运营商关系实例创建期间,会启用这些层中的日志数据收集。 收集到的这些日志将路由到 Azure Monitor LAW。

你还可以从为运行容器化和虚拟化网络功能而创建的租户层收集数据。 可以收集的日志数据包括:

  • 来自虚拟机的 syslog 集合(用于 VNF 或 CNF 工作负载)。
  • 来自 Kubernetes 群集和其上部署的应用程序的日志集合。

你将需要启用从租户 Kubernetes 群集和虚拟机收集日志的功能。 应按照以下步骤来部署 Azure 监视代理。 会在 Azure LAW 中收集数据。

运营商关系日志存储

Azure Monitor 日志中的数据以表形式存储,每个表具有自己独有的属性集。

Azure Monitor 中的所有资源日志都具有后跟服务特定字段的相同字段;请参阅常见架构

来自运营商关系平台的日志存储在下表中:

说明
Syslog 使用 Log Analytics 代理的 Linux 计算机上的 Syslog 事件
ContainerInventory 每个容器的详细信息和当前状态。
ContainerLog 从容器的 stdout 和 stderr 流收集的日志行
ContainerNodeInventory 充当容器主机的节点的详细信息。
InsightMetrics 从服务器、K8s、容器收集的指标。
KubeEvents Kubernetes 事件及其属性。
KubeMonAgentEvents Azure Monitor Kubernetes 代理记录的错误和警告事件。
KubeNodeInventory Kubernetes 群集中包含的节点的详细信息
KubePodInventory Kubernetes Pod 及其属性
KubePVInventory Kubernetes 永久性卷及其属性。
KubeServices Kubernetes 服务及其属性
Heartbeat Log Analytics 代理每分钟记录一次的记录,用于报告代理运行状况

运营商关系指标

“日志”部分中的“InsightMetrics”表包含从裸机计算机和 undercloud Kubernetes 群集收集的指标。 此外,可以从 Azure Monitor 菜单打开“指标”选项卡,观察从 undercloud 收集的几个所选指标。

Azure Monitor 指标选择的屏幕截图。

图:Azure Monitor 指标选择

有关使用此工具的详细信息,请参阅使用 Azure Monitor 指标资源管理器分析指标

工作簿

工作簿将文本、日志查询、指标和参数组合在一起,用于数据分析和创建多种丰富的可视化效果。 你可以使用用于实现运营商关系日志记录和监视的示例 Azure 资源管理器工作簿模板,以在 Azure LAW 中部署 Azure 工作簿。

警报

你可以使用适用于运营商关系警报规则的示例 Azure 资源管理器警报模板。 应为警报指定阈值和条件。 然后,可以在本地环境中部署这些警报模板。

Log Analytic 工作区

Log Analytics 工作区 (LAW) 是一个独特的环境,用于记录来自 Azure Monitor 和其他 Azure 服务的数据。 每个工作区都有其自己的数据存储库和配置,但可以合并来自多个服务的数据。 每个工作区都包含多个数据表。

可以创建单个 LAW,根据运营商要求收集所有相关数据或多个工作区。