什麼是 Azure Stack HCI 監視?
適用於:Azure Stack HCI 版本 23H2
本文提供 Azure Stack HCI 監視的概觀。
監視 Azure Stack HCI 牽涉到從系統的所有元件定期收集和分析數據,以立即識別並解決任何潛在問題。 例行監視對於維護 Azure Stack HCI 系統的健康情況和功能非常重要。
若要瞭解目前的效能模式、識別效能異常,以及開發解決問題的方法,請務必在不同的時間和負載狀況下為系統設定基準效能計量。
Azure Stack HCI 會利用 Azure 監視器工具,例如 Insights、計量、記錄、活頁簿和警示。 這些工具有助於從您建立的基準收集數據、分析和主動回應一致或趨勢差異。
高階結構
大致上,Azure Stack HCI 監視的架構包含下列重要元件:
- 部署擴充功能以收集記錄、計量、遙測和警示。
- 使用 Azure 監視器工具,例如深入解析、計量、記錄、活頁簿和警示,以有效地分析、可視化及響應數據。
下圖是 Azure Stack HCI 監視實作的架構表示法。
Azure Stack HCI 中的監視功能
本節說明 Azure Stack HCI 中的監視功能。
深入解析
深入解析是 Azure 監視器的一項功能,可讓您使用記錄快速開始監視 Azure Stack HCI 叢集。 您可以使用 Insights 來同時監視單一 Azure Stack HCI 叢集或多個叢集。 Azure Stack HCI 的深入解析會使用 Azure 監視器代理程式以記錄形式收集數據,然後將數據儲存在 Log Analytics 工作區中。 它會使用 Kusto 查詢語言 (KQL) 來查詢 Log Analytics 工作區,並使用 Azure 活頁簿將結果可視化。 若要瞭解如何使用 Insights 監視單一或多個叢集,請參閱 使用 Insights 監視單一叢集 或使用 Insights 監視多個叢集。
透過適用於 Azure Stack HCI 的深入解析,您可以存取具有基本計量的預設活頁簿,以及用來監視 Azure Stack HCI 重要功能的特製化活頁簿。 若要深入了解這些功能活頁簿,請參閱 使用 Insights 監視 HCI 功能。
計量
Azure Stack HCI 可讓您將叢集的數值資料儲存在專用的時間序列資料庫中。 此數據是使用遙測和診斷 Arc 延伸模組收集,然後使用計量瀏覽器進行分析。 若要深入瞭解計量,請參閱 使用 Azure 監視器計量監視 Azure Stack HCI。
警示
當您的監視資料中發現重要條件時,警示會主動通知您。 它們可讓您在系統使用者注意到問題之前,找出並解決問題。 回應可能是管理員的文字或電子郵件,或是嘗試更正錯誤狀況的自動化流程。 您可以針對從 Azure Stack HCI 系統收集的任何計量或記錄數據發出警示。
如需警示的詳細資訊,請參閱 什麼是 Azure 監視器警示?
警示類型
下表提供 Azure Stack HCI 中每個警示類型的簡短描述和設定指示:
警示類型 | Description | 如何設定 |
---|---|---|
健康狀態警示 | 這些是系統產生的警示,不需要額外費用。 您不需要設定 Log Analytics 或手動建立任何警示規則。 | 請參閱 設定 Azure Stack HCI 的健康情況警示。 |
以記錄為基礎的警示 | 這些是客戶定義的警示,可用來對記錄數據執行進階邏輯作業。 這些警示可讓您使用Log Analytics查詢,以預先定義的頻率評估資源記錄。 | 請參閱 設定 Azure Stack HCI 的記錄警示。 |
計量型警示 | 這些是客戶定義的警示,可用來定期評估 Azure Stack HCI 系統的計量。 當您想要收到哪些資料需要少量操作或不需要操作的相關警示時,計量警示會很有用。 | 請參閱 設定 Azure Stack HCI 的計量警示。 |
建議的警示 | 這些是 Azure Stack HCI 叢集資源的預先定義計量型警示。 這些警示提供您一組常見計量的初始監視,包括CPU百分比和可用的記憶體。 | 請參閱 啟用 Azure Stack HCI 的建議警示規則。 |