使用 azdata 和 Grafana 仪表板监视大数据群集

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

本文介绍如何监视 SQL Server 大数据群集 内的应用程序。 SQL Server 2019 大数据群集公开 Grafana 仪表板用于监视,这些指标存储在 influxDB 中。 这些指标分类如下:

  • Telegraf 收集的与 Kubernetes 主机相关的指标,Telegraf 是用于收集、处理、聚合和写入指标的代理。
  • 工作负载相关指标:CollectD 收集与 SQL Server、Spark 和 HDFS 相关的指标,包括 SQL Server DMV 指标和 SQL Server 扩展事件 (XEvents)

重要

Internet Explorer 浏览器和旧版 Microsoft Edge 浏览器与 Grafana 不兼容。 在 Grafana 中,当使用不受支持的浏览器时,将出现包含错误的黑色页面。 请考虑使用基于 Chromium 的 Microsoft Edge,或查看 Grafana 支持的浏览器

可用度量值

SQL Server 大数据群集 中提供以下指标:

类别 说明 指标
托管节点指标 与 Kubernetes 主机相关的指标 CPU、RAM 使用情况、磁盘 IOPS、负载平均值等。
Pod 和容器指标 与 Kubernetes Pod 和容器相关的指标,Grafana 允许按 Pod 甚至特定容器筛选这些指标。 CPU、RAM、磁盘和网络使用情况。
SQL Server 指标 与 SQL Server 相关的指标 事务数/秒、批请求数/秒、数据库活动、SQL Server 活动等。要特别注意的是,如果启用了 ContainerAG,还可以从此处监视 alwaysOn。
Spark 指标 与 Spark 应用相关的指标。 执行程序 hdfs 写入、JVM GC 时间、JVM 堆使用情况等。
应用指标 与 SQL Server 大数据群集 上部署的应用相关的指标,Grafana 允许按特定应用和应用版本筛选这些指标。 CPU、RAM 和 HTTP 请求状态。

必备条件

功能

在 SQL Server 2019 中,可以创建、删除、描述、初始化、列出、运行和更新应用程序。 下表介绍了可以与 azdata 一起使用的应用程序部署命令。

Command 说明
azdata bdc endpoint list 列出大数据群集的终结点。

可以使用以下示例列出 Grafana 仪表板的终结点:

azdata bdc endpoint list --endpoint-name metricsui 

输出会为你显示终结点,你可以使用群集用户名和密码进行登录。

A screenshot of the endpoint of the Grafana Dashboard.

nodeMetricsUrlsqlMetricsUrl 值链接到 Grafana 仪表板用来监视 Kubernetes 节点指标和大数据群集服务指标:

A screenshot of the Grafana dashboard showing the Host Node Metrics.

A screenshot from Grafana showing the SQL Server Metrics.