你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

托管 Prometheus 中的控制平面指标的最小引入配置文件

默认情况下,Azure Monitor 指标加载项会收集多种 Prometheus 指标。 Minimal ingestion profile 是一种有助于减少指标引入量的设置,因为只有默认仪表板使用的指标,才会收集默认记录规则和默认警报。 本文介绍如何为控制平面指标专门配置此设置。 本文还列出了启用 minimal ingestion profile 时默认收集的指标。

注意

对于基于加载项的集合,Minimal ingestion profile 设置默认处于启用状态。 本文的讨论侧重于控制平面指标。 此处列出了当前的默认目标和指标集。

以下目标默认处于“已启用/ON”状态,这意味着你不必提供任何抓取作业配置来抓取这些目标,因为指标加载项默认会自动抓取这些目标:

  • controlplane-apiserver (job=controlplane-apiserver)
  • controlplane-etcd (job=controlplane-etcd)

以下目标可抓取,但默认情况下不启用(“已禁用/OFF”)抓取。 这意味着无需提供任何抓取作业配置来抓取这些目标,并且需要使用 default-scrape-settings-enabled 部分下的 ama-metrics-settings-configmap 来“ON/启用”这些目标的抓取。

  • controlplane-cluster-autoscaler
  • controlplane-kube-scheduler
  • controlplane-kube-controller-manager

注意

所有默认目标和抓取的默认抓取频率为 30 seconds。 可以使用 default-targets-scrape-interval-settings 部分下的 ama-metrics-settings-configmap 替代每个目标。

默认 ON 目标的最少引入

默认 ON 目标允许使用 minimalingestionprofile=true 列出以下指标。 默认情况下会收集以下指标,因为这些目标默认已抓取。

controlplane-apiserver

  • apiserver_request_total
  • apiserver_cache_list_fetched_objects_total
  • apiserver_cache_list_returned_objects_total
  • apiserver_flowcontrol_demand_seats_average
  • apiserver_flowcontrol_current_limit_seats
  • apiserver_request_sli_duration_seconds_bucket
  • apiserver_request_sli_duration_seconds_sum
  • apiserver_request_sli_duration_seconds_count
  • process_start_time_seconds
  • apiserver_request_duration_seconds_bucket
  • apiserver_request_duration_seconds_sum
  • apiserver_request_duration_seconds_count
  • apiserver_storage_list_fetched_objects_total
  • apiserver_storage_list_returned_objects_total
  • apiserver_current_inflight_requests

controlplane-etcd

  • etcd_server_has_leader
  • rest_client_requests_total
  • etcd_mvcc_db_total_size_in_bytes
  • etcd_mvcc_db_total_size_in_use_in_bytes
  • etcd_server_slow_read_indexes_total
  • etcd_server_slow_apply_total
  • etcd_network_client_grpc_sent_bytes_total
  • etcd_server_heartbeat_send_failures_total

默认 OFF 目标的最少引入

默认 OFF 目标允许使用 minimalingestionprofile=true 列出以下指标。 默认情况下不收集以下指标。 可以使用 default-scrape-settings-enabled 部分下的 ama-metrics-settings-configmap 使用 default-scrape-settings-enabled.<target-name>=true 开启这些目标的抓取。

controlplane-kube-controller-manager

  • workqueue_depth
  • rest_client_requests_total
  • rest_client_request_duration_seconds

controlplane-kube-scheduler

  • scheduler_pending_pods
  • scheduler_unschedulable_pods
  • scheduler_queue_incoming_pods_total
  • scheduler_schedule_attempts_total
  • scheduler_preemption_attempts_total

controlplane-cluster-autoscaler

  • rest_client_requests_total
  • cluster_autoscaler_last_activity
  • cluster_autoscaler_cluster_safe_to_autoscale
  • cluster_autoscaler_failed_scale_ups_total
  • cluster_autoscaler_scale_down_in_cooldown
  • cluster_autoscaler_scaled_up_nodes_total
  • cluster_autoscaler_unneeded_nodes_count
  • cluster_autoscaler_unschedulable_pods_count
  • cluster_autoscaler_nodes_count
  • cloudprovider_azure_api_request_errors
  • cloudprovider_azure_api_request_duration_seconds_bucket
  • cloudprovider_azure_api_request_duration_seconds_count

注意

无论配置文件如何,都不会公开所有控制平面目标的 CPU 和内存使用情况指标。

参考

后续步骤