使用 Azure 受控 Prometheus 和 Grafana 進行監視
注意
AKS 上的 Azure HDInsight 將於 2025 年 1 月 31 日退場。 請於 2025 年 1 月 31 日之前,將工作負載移轉至 Microsoft Fabric 或對等的 Azure 產品,以免工作負載突然終止。 訂用帳戶中剩餘的叢集將會停止,並會從主機移除。
在淘汰日期之前,只有基本支援可用。
重要
此功能目前為預覽功能。 Microsoft Azure 預覽版增補使用規定包含適用於 Azure 功能 (搶鮮版 (Beta)、預覽版,或尚未正式發行的版本) 的更多法律條款。 若需此特定預覽版的相關資訊,請參閱 Azure HDInsight on AKS 預覽版資訊。 如有問題或功能建議,請在 AskHDInsight 上提交要求並附上詳細資料,並且在 Azure HDInsight 社群上追蹤我們以獲得更多更新資訊。
叢集和服務監視是任何組織不可或缺的一部分。 Azure HDInsight on AKS 隨附 Azure 服務的整合式監視體驗。 在本文中,我們會使用受控 Prometheus 服務搭配 Azure Grafana 儀表板進行監視。
Azure 受控 Prometheus 是監視雲端環境的服務。 監視是要維護其可用性和效能與工作負載計量。 它會收集 Azure 執行個體中的資源以及其他監視工具所產生的資料。 該資料可用於提供跨多個來源的分析。
Azure 受控 Grafana 是Grafana Labs 在 Grafana 軟體之上所建置的資料視覺效果平台。 其建置為由 Microsoft 營運及支援的完全受控 Azure 服務。 Grafana 可協助您將計量、記錄和追蹤合併成單一使用者介面。 透過對資料來源和圖形功能的廣泛支援,您可以即時檢視和分析您的應用程式和基礎結構遙測資料。
本文涵蓋在 HDInsight on AKS 中啟用監視功能的詳細資料。
必要條件
- Azure 受控 Prometheus 工作區。 您可以將此工作區視為唯一的 Azure 監視器記錄環境,有其自己的資料存放庫、資料來源和方案。 如需指示,請參閱建立 Azure 受控 Prometheus 工作區。
- Azure 受控 Grafana 工作區。 如需指示,請參閱建立 Azure 受控 Grafana 工作區。
- HDInsight on AKS 叢集。 目前,您可以使用具有以下 HDInsight on AKS 叢集類型的 Azure 受控 Prometheus:
- Apache Spark™
- Apache Flink®
- Trino
如需如何建立 HDInsight on AKS 叢集的指示,請參閱開始使用 Azure HDInsight on AKS。
啟用 Azure 受控的 Prometheus 和 Grafana
Azure 受控 Prometheus 和 Grafana 監視必須在叢集集區層級設定,才能在叢集層級啟用。 啟用監視解決方案時,您需要考慮各種階段。
# | 案例 | 啟用 | 停用 |
---|---|---|---|
1 | 叢集集區 - 建立期間 | Not Supported |
Default |
2 | 叢集集區 - 建立後 | Supported |
Not Supported |
3 | 叢集 - 建立期間 | Supported |
Default |
4 | 叢集 - 建立後 | Supported |
Supported |
叢集建立期間
目前,受控 Prometheus 無法在叢集集區建立期間啟用。 您可以在建立叢集集區後進行設定。
叢集集區建立後
您可以從 Azure 入口網站中可用現有叢集集區檢視的 [整合] 索引標籤啟用監視。 您可以在設定叢集集區的監視時,使用預先建立的工作區或建立新的工作區。
使用預先建立的工作區
在叢集集區中啟用監視時,建立 Azure Prometheus 和 Grafana 工作區
您可以從 AKS 叢集集區頁面上的 HDI 建立工作區。
按兩下 [Azure Prometheus] 選項旁的 [設定]。
按兩下為 Azure 受控 Prometheus [建立新的] 工作區。
填入名稱、區域,然後按兩下為 Prometheus [建立]。
按兩下為 Azure 受控 Grafana [建立新的] 工作區。
填入名稱、區域,然後按兩下為 Grafana [建立]。
注意
- 只有在已啟用受控 Prometheus 時,才能啟用受控 Grafana。
- 從 HDInsight on AKS 叢集擊區啟用 Azure 受控 Prometheus 工作區和 Azure 受控 Grafana 工作區之後,就無法再次從叢集集區停用。 必須從叢集層級停用。
在叢集建立期間
在叢集建立期間啟用 Azure 受控 Prometheus
建立叢集集區並啟用 Azure 受控 Prometheus 之後,使用者必須在同一個叢集集集區中的 AKS 叢集上建立 HDI。
在叢集建立程式期間,導覽至 [整合] 頁面,然後啟用 Azure Prometheus。
叢集建立後
您也可以在 AKS 叢集建立上啟用 Azure 受控 Prometheus 張貼 HDI
瀏覽至叢集頁面中的 [整合] 索引標籤。
使用切換按鈕啟用 Azure Prometheus 監視,然後按下 [儲存]。
注意
同樣地,如果您需要停用 Azure Prometheus 監視,可以藉由停用切換按鈕並按兩下 [儲存] 來完成。
啟用必要權限
若要從 HDInsight on AKS 入口網站檢視 Azure 受控 Prometheus 和 Azure 受控 Grafana,您必須擁有特定權限,如下所示。
使用者權限:若要檢視 Azure 受控 Grafana,Azure 受控 Grafana 工作區中的使用者需要「Grafana Viewer」角色,存取控制 (IAM)。 在這裡檢視如何授與使用者存取權。
開啟叢集集區中設定的 Grafana 工作區。
選取 [角色] 作為 Grafana Viewer
選取正在存取 Grafana 儀表板的使用者名稱。
選取使用者,然後按兩下 [檢閱+ 指派]
注意
如果用戶預先建立 Azure 受控 Prometheus,Grafana 身分識別需要額外的監視讀取器權限。
在 [Grafana 工作區] 頁面 (連結至叢集的工作區) 中,會在 [身分識別] 索引標籤中提供監視讀取器 權限。
按一下 [新增角色指派]。
選擇下列參數
- 將 [範圍] 設定為 [訂用帳戶]
- 訂用帳戶名稱。
- 作為監視讀者的角色
注意
如需檢視 Grafana 使用者的其他角色,請參閱這裡。
檢視計量
在此案例中,我們會使用 Apache Spark™ 叢集作為範例,假設叢集中執行作業很少,以取得計量。
檢閱下列步驟以使用 Grafana 範例範本:
從此處下載個別工作負載的範例範本 (在此案例中下載Apache Spark 範本)。
從您的叢集登入 Grafana 儀表板。
開啟 Grafana 儀表板頁面之後,按兩下 [新增] > [匯入]
單擊 [上傳儀表板 JSON 檔案],並上傳您已下載的 Apache Spark Grafana 範本,然後按兩下 [匯入] 。
上傳完成後,您可以按兩下儀表板來檢視計量。
參考
- Apache、Apache Spark、Spark 和相關聯的開放原始碼專案名稱為 Apache Software Foundation (ASF) 的商標。