你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Azure 托管 Prometheus 和 Grafana 进行监视

重要

此功能目前以预览版提供。 Microsoft Azure 预览版的补充使用条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览版的信息,请参阅 Azure HDInsight on AKS 预览版信息。 如有疑问或功能建议,请在 AskHDInsight 上提交请求并附上详细信息,并在 Azure HDInsight Community 上关注我们以了解更多更新。

群集和服务监视是任何组织不可或缺的一部分。 AKS 上的 Azure HDInsight 附带了 Azure 服务的集成监视体验。 在本文中,我们将托管 Prometheus 服务与 Azure Grafana 仪表板配合使用进行监视。

Azure 托管 Prometheus 是一项监视云环境的服务。 该监视服务用于维持上述环境和与工作负荷指标的可用性和性能。 它收集 Azure 实例和其他监视工具中由资源生成的数据。 而数据用于提供跨多个源的分析。

Azure 托管 Grafana 是 Grafana Labs 基于 Grafana 软件构建的数据可视化平台。 它构建为由 Microsoft 运营和支持的完全托管的 Azure 服务。 Grafana 可帮助你将指标、日志和跟踪整合到单个用户界面中。 凭借对数据源和图形功能的广泛支持,可以实时查看和分析应用程序和基础结构遥测数据。

本文介绍在 AKS 上的 HDInsight 中启用监视功能的详细信息。

先决条件

有关如何在 AKS 群集上创建 HDInsight 的说明,请参阅 AKS 上的 Azure HDInsight 入门

启用 Azure 托管 Prometheus 和 Grafana

必须在群集池级别配置 Azure 托管 Prometheus 和 Grafana 监视,以便在群集级别启用它。 启用监视解决方案时,需要考虑各个阶段。

# 方案 启用 禁用
1 群集池 - 在创建期间 Not Supported Default
2 群集池 - 创建后 Supported Not Supported
3 群集 - 在创建期间 Supported Default
4 群集 - 创建后 Supported Supported

在创建群集池期间

目前,无法在群集池创建期间启用托管 Prometheus。 可以在创建群集池后对其进行配置。

创建群集池后

可以从 Azure 门户中可用的现有群集池视图上的“集成”选项卡启用监视。 可以在为群集池配置监视时使用预先创建的工作区或创建新的工作区。

使用预先创建的工作区

  1. 单击“配置”以启用 Azure Prometheus 监视。

    屏幕截图显示了集成“配置”选项卡。

  2. 单击“高级设置”附加预先创建的工作区。

    显示高级设置的屏幕截图。

    屏幕截图显示了配置 Prometheus 的第 1 步。

在群集池中启用监视的同时创建 Azure Prometheus 和 Grafana 工作区

可以从 AKS 群集池页上的 HDI 创建工作区。

  1. 单击 Azure Prometheus 选项旁边的“配置”

    屏幕截图显示了配置 Prometheus 的第 2 步。

  2. 单击“为 Azure 托管 Prometheus 创建新工作区”

    屏幕截图显示了配置 Prometheus 的第 3 步。

  3. 填写名称、区域,然后单击“为 Prometheus 创建”

    屏幕截图显示了配置 Prometheus 的第 4 步。

  4. 单击“为 Azure 托管 Grafana 创建新工作区”

  5. 填写名称、区域,然后单击“为 Grafana 创建”

    屏幕截图显示了配置 Prometheus 的第 5 步。

    注意

    1. 仅当启用了托管 Prometheus 时,才能启用托管 Grafana。
    2. 从 AKS 群集池上的 HDInsight 启用 Azure 托管 Prometheus 工作区和 Azure 托管 Grafana 工作区后,无法再次从群集池中禁用它。 必须从群集级别禁用它。

在创建群集期间

在创建群集期间启用 Azure 托管 Prometheus

  1. 创建群集池并启用 Azure 托管 Prometheus 后,用户必须在同一群集池中的 AKS 群集上创建 HDI

  2. 在群集创建过程中,导航到“集成”页并启用 Azure Prometheus。

    屏幕截图显示了启用 Prometheus 监视。

创建群集后

还可以在创建 AKS 群集时启用 HDI 后 Azure 托管 Prometheus

  1. 导航到群集页中的“集成”选项卡。

  2. 使用切换按钮启用 Azure Prometheus 监视,然后单击“保存”

    屏幕截图显示了如何保存配置。

    注意

    同样,如果需要禁用 Azure Prometheus 监视,可以通过禁用切换按钮并单击“保存”来完成。

启用所需的权限

若要从 AKS 门户上的 HDInsight 查看 Azure 托管 Prometheus 和 Azure Managed Grafana,需要具有以下特定权限。

用户权限:若要查看 Azure 托管 Grafana,Azure 托管 Grafana 工作区中的用户需要“Grafana 观看者”角色,访问控制 (IAM)。 此处查看如何授予用户访问权限。

  1. 打开群集池中配置的 Grafana 工作区。

  2. 角色选择为 Grafana 观看者

  3. 选择访问 Grafana 仪表板的用户名。

  4. 选择用户并单击“审阅 + 分配”

    注意

    如果用户正在预先创建 Azure 托管 Prometheus,Grafana 标识需要监视读取者的其他权限。

  5. 在 Grafana 工作区页(链接到群集的工作区页)中提供“标识”选项卡中的“监视读取者”权限。

    屏幕截图显示了如何分配角色。

  6. 单击“添加角色分配

  7. 选择下列参数

    1. 范围定义为“订阅”
    2. 订阅名称。
    3. 角色定为“监视读取者”

    屏幕截图显示了如何分配角色。

    注意

    若要查看 Grafana 用户的其他角色,请参阅此处

查看指标

在本例中,我们以 Apache Spark™ 群集为例,假设群集中执行了几个作业,以便获取指标。

查看以下步骤以使用 Grafana 示例模板:

  1. 此处下载相应工作负载的示例模板(在本例中下载 Apache Spark 模板)。

  2. 从群集登录到 Grafana 仪表板。

    屏幕截图显示了如何设置时间范围。

  3. 打开 Grafana 仪表板页面后,单击“新建并导入”

    屏幕截图显示了如何设置指标类型。

  4. 单击“上传仪表板 JSON 文件”并上传已下载的 Apache Spark Grafana 模板,然后单击“导入”

    屏幕截图显示了如何运行查询。

  5. 上传完成后,可以单击仪表板查看指标。

    屏幕截图显示了如何查看输出。

参考