分享方式:


監視 Azure 虛擬機器

本文章說明:

  • 您可以為此服務收集的監視資料類型。
  • 分析資料的方式。

注意

如果您已經熟悉此服務和/或 Azure 監視器,只想知道如何分析監視資料,請參閱本文靠近結尾的分析一節。

當您有依賴 Azure 資源的重要應用程式和商務流程時,就需要監視並取得系統的警示。 Azure 監視器服務會從您系統的每個元件收集及彙總計量和記錄。 Azure 監視器讓您能夠檢視可用性、效能及復原能力,並在發生問題時通知您。 您可以使用 Azure 入口網站、PowerShell、Azure CLI、REST API 或用戶端程式庫來設定及檢視監視資料。

此文章概述如何監視 Azure 虛擬機器 (VMs) 的健康情況和效能。

注意

本文提供基本資訊協助您開始監視 Azure 虛擬機器。 關於監視 Azure 和混合式虛擬機器的整個環境,如需完整指南,請參閱監視虛擬機器部署指南

概觀:監視 VM 主機和客體計量和記錄

下列項目可以收集計量和記錄:

  • VM 主機 - 此資料與管理客體作業系統的 Hyper-V 工作話有關,並包含 CPU、網路和磁碟使用率的相關資訊。
  • VM 客體 - 此資料與虛擬機內執行的作業系統和應用程式有關。

主機層級資料可讓您了解 VM 的整體效能和負載,而客體層級資料可讓您查看電腦上執行的應用程式、元件和程序,以及其效能和健康情況。 例如,如果您針對效能問題進行疑難排解,您可以從主機計量開始查看哪些 VM 負載過重,然後使用客體計量向下切入作業系統和應用程式效能的詳細資料。

VM 主機資料

VM 主機資料不需要額外的設定即可使用。

案例 詳細資料 資料集合 可用的資料 建議
VM 主機計量和記錄 監視 VM 執行所在的實體主機的穩定性、健康情況和效率。
根據應用程式負載相應增加或相應減少
根據預設,不用任何額外設定即可使用。 啟用建議的警示規則以在主要主機計量偏離其預期的基準值時收到通知。

VM 客體資料

VM 客體資料可讓您分析 VM 上執行的工作負載效能和作業效率並進行疑難排解。 若要監視 VM 客體資料,您必須在 VM 上安裝 Azure 監視器代理程式,並設定資料收集規則 (DCR)VM 深入解析功能會自動在您的 VM 上安裝 Azure 監視器代理程式,並設定預設資料收集規則,以便快速且輕鬆上線。

案例 詳細資料 資料集合 可用的資料 建議
基本監視:關鍵效能指標 藉由收集預先定義的一組基本關鍵性能計數器,找出作業系統效能相關的問題,包括 CPU 和磁碟使用率 -- 可用的記憶體和網路效能。 啟用 VM 深入解析 預先定義的一組主要客體性能計數器
基礎監視:應用程式元件對應 對應特定 VM 上的應用程式元件,以及跨 VM,並探索應用程式元件之間存在的相依性。

這項資訊對於疑難排解、最佳化效能,以及規劃應用程式基礎結構的變更或更新非常重要。
地圖是 VM 深入解析的對應功能 VM 上執行的應用程式元件之間的相依性
VM 作業系統計量和記錄 (建議) 監視應用程式效能和事件、特定應用程式和進程的資源耗用量,以及作業系統層級的效能和事件。

這項資料對於針對應用程式特定問題進行疑難排解、最佳化 VM 內的資源使用量,以及確保 VM 內執行的工作負載達到最佳效能非常重要。
在 VM 上安裝 Azure 監視器代理程式,並設定 DCR
  • 在 Windows 中,收集重大錯誤警告層級的應用程式記錄。
  • 在 Linux 中,收集 LOG_WARNING 層級的 LOG_SYSLOG 設備記錄。
進階/自定義 VM 客體資料 監視 Web 伺服器、Linux 設備,以及您想要從 VM 收集的任何類型的資料。 在 VM 上安裝 Azure 監視器代理程式,並設定 DCR

VM 深入解析

VM 深入解析在單一介面中監視您的 Azure 和混合式虛擬機器。 VM 深入解析提供下列優點來監視 Azure 監視器中的 VM:

  • Azure 監視器代理程式和相依性代理程式的簡易上線,可讓您監視虛擬機器 (VM) 客體作業系統和工作負載。
  • 預先定義的資料收集規則,可收集最常見的效能資料集。
  • 預先定義的趨勢效能圖表和活頁簿,可讓您從虛擬機器的客體作業系統分析核心效能計量。
  • 相依性對應,其會顯示在每部虛擬機器上執行的處理程序,以及與其他機器和外部來源的互連元件。

VM 深入解析 [邏輯磁碟效能] 檢視的螢幕擷取畫面。

VM 深入解析 [對應] 檢視的螢幕擷取畫面。

如需針對虛擬機器啟用 VM 深入解析的教學課程,請參閱針對 Azure 虛擬機器啟用 VM 深入解析的監視。 如需有關啟用深入解析和 VM 各種上線方法的一般資訊,請參閱啟用 VM 深入解析概觀

如果您啟用 VM 深入解析,系統會安裝 Azure 監視器代理程式,並開始將預先定義的效能資料組合傳送至 Azure 監視器記錄。 您可以建立其他資料收集規則來收集事件和其他效能資料。 若要了解如何安裝 Azure 監視器代理程式,以及建立資料收集規則 (DCR) 來定義要收集的資料,請參閱教學課程:從 Azure 虛擬機器收集客體記錄和計量

在 VM 深入解析中,您可以使用 Azure 監視器對應功能來檢視在 Azure 或環境中執行的應用程式元件。 Dependency Agent VM 延伸模組可供 WindowsLinux 使用。

資料存放區

對於 Azure 監視器:

  • 計量資料會儲存在 Azure 監視器計量資料庫中。
  • 記錄資料會儲存在 Azure 監視器記錄存放區中。 Log Analytics 是可查詢此存放區的 Azure 入口網站工具。
  • Azure 活動記錄是個單獨存放區,其介面位於 Azure 入口網站。

您可選擇性地將計量和活動記錄資料路由傳送至 Azure 監視器記錄存放區。 然後,可以使用 Log Analytics 來查詢資料,並將其與其他記錄資料相互關聯。

許多服務可以使用診斷設定,將計量和記錄資料傳送至 Azure 監視器以外的其他儲存位置。 範例包括 Azure 儲存體、託管的合作夥伴系統以及使用事件中樞的非 Azure 合作夥伴系統

如需進一步了解 Azure 監視器如何儲存資料,請參閱 Azure 監視器資料平台

Azure 監視器平台計量

Azure 監視器為大多數服務提供平台計量。 這些計量包括:

  • 針對每個命名空間個別定義。
  • 儲存在 Azure 監視器時間序列計量資料庫中。
  • 輕量且能支援近即時警示。
  • 用來追蹤資源效能的長期變化。

收集:Azure 監視器會自動收集平台計量。 不需要組態。

路由:通常您也可以將平台計量路由傳送至 Azure 監視器記錄/Log Analytics,以便與其他記錄資料一同查詢。 如需詳細資訊,請參閱計量診斷設定 (機器翻譯)。 如需了解如何設定服務的診斷設定,請參閱在 Azure 監視器中建立診斷設定 (機器翻譯)。

如需 Azure 監視器中所有資源可收集的計量完整清單,請參閱 Azure 監視器中所支援的計量

Azure VM 的平台計量包括重要的主機計量,例如 CPU、網路和磁碟使用率。 主機 OS 計量與裝載客體作業系統 (客體 OS) 工作階段的 Hyper-V 工作階段有關。

在 VM 中執行的客體 OS 計量,必須透過一或多個代理程式來收集,例如在客體 OS 上執行或作為客體 OS 一部分執行的 Azure 監視器代理程式。 客體 OS 計量包括可追蹤客體 CPU 百分比或記憶體使用量的效能計數器,這兩者經常用於自動調整或警示。 如需詳細資訊,請參閱客體 OS 和主機 OS 計量

如需 Azure 監視器代理程式如何收集 VM 監視資料的詳細資訊,請參閱使用 Azure 監視器監視虛擬機:收集資料

如需虛擬機器可用計量的清單,請參閱虛擬機監視資料參考

Azure 活動記錄 (部分機器翻譯)

活動記錄包含訂用帳戶層級事件,用於追蹤每個 Azure 資源外部可見的作業;例如,建立新的資源或啟動虛擬機器。

收集:活動記錄事件會自動產生並收集至個別存放區中,以便使用者在 Azure 入口網站中檢視。

路由:您可以將活動記錄資料傳送至 Azure 監視器記錄,以便與其他記錄資料一起分析。 您也可以使用其他位置,例如 Azure 儲存體、Azure 事件中樞及特定 Microsoft 監視合作夥伴。 如需進一步了解如何路由傳送活動記錄,請參閱 Azure 活動記錄概觀 (機器翻譯)。

資料收集規則

資料收集規則 (DCR) 定義來自 Azure 監視器代理程式的資料收集,並儲存在您的 Azure 訂用帳戶中。 針對 VM,DCR 會定義事件和效能計數器等資料,以收集並指定位置,例如傳送資料的 Log Analytics 工作區。 單一 VM 可以與多個 DCR 相關聯,而一個 DCR 可以與多個 VM 相關聯。

VM 深入解析 DCR

VM 深入解析會建立 DCR,這會收集用戶端作業系統的常見效能計數器,並會傳送至 Log Analytics 工作區中的 InsightsMetrics 資料表。 如需收集效能計數器清單,請參閱如何從 VM 深入解析查詢記錄。 您可以將此 DCR 與其他 VM 搭配使用,而不是為每個 VM 建立新的 DCR。

您也可以選擇性地啟用進程和相依性的集合,以填入下表並啟用 VM 深入解析對應功能。

分析監視資料

有許多工具可用來分析監視資料。

Azure 監視器工具

Azure 監視器支援下列基本工具:

支援更複雜視覺效果的工具包括:

  • 儀表板 (機器翻譯) 可讓您將不同類型的資料合併到 Azure 入口網站中的單一窗格。
  • 活頁簿 (機器翻譯) 是能在 Azure 入口網站中建立的可自訂報表。 活頁簿可以包含文字、計量及記錄查詢。
  • Grafana 是在操作儀表板中表現相當出色的開放平台工具。 您可以使用 Grafana 來建立儀表板,納入 Azure 監視器以外多個來源的資料。
  • Power BI (機器翻譯) 是一項商務分析服務,可提供跨各種資料來源的互動式視覺效果。 你可以將 Power BI 設定為自動從 Azure 監視器匯入記錄資料,以利用這些視覺效果。

Azure 監視器匯出工具

您可以使用下列方法將資料從 Azure 監視器中提取至其他工具:

若要開始使用適用於 Azure 監視器的 REST API,請參閱 Azure 監視 REST API 逐步解說 (機器翻譯)。

Kusto 查詢

您可以使用 Kusto 查詢語言 (KQL) 分析 Azure 監視器記錄/Log Analytics 存放區中的監視資料。

重要

當您從入口網站的服務功能表中選取 [記錄] 時,Log Analytics 會隨即開啟,並將查詢範圍設定為目前的服務。 此範圍表示記錄查詢只會包含該資源類型的資料。 如果您想要執行包含其他 Azure 服務資料的查詢,請從 [Azure 監視器] 功能表中選取 [記錄]。 如需詳細資訊,請參閱 Azure 監視器 Log Analytics 中的記錄查詢範圍和時間範圍

如需各項服務的常見查詢清單,請參閱 Log Analytics 查詢介面 (機器翻譯)。

若要分析您從 VM 收集的記錄資料,您可以使用 Log Analytics 中的記錄查詢。 VM 有數個內建查詢可用,您也可以建立自己的查詢。 您可以透過互動方式使用這些查詢的結果、加入活頁簿中供其他使用者使用,或根據其結果來產生警示。

若要存取 VM 的內建 Kusto 查詢,請在 VM Azure 入口網站頁面左側導覽的 [監視] 區段中選取 [記錄]。 在 [記錄] 頁面上,選取 [查詢] 索引標籤,然後選取要執行的查詢。

[記錄] 窗格顯示 Log Analytics 查詢結果的螢幕擷取畫面。

警示

在監視資料中發現特定狀況時,Azure 監視器警示會主動通知您。 警示可讓您在客戶發現系統發生問題前,就先及早識別和解決問題。 如需詳細資訊,請參閱 Azure 監視器警示

Azure 資源的常見警示有許多來源。 如需 Azure 資源的常見警示範例,請參閱記錄警示查詢範例 (機器翻譯)。 Azure 監視器基準警示 (AMBA) 網站提供半自動化方法來實作重要的平台計量警示、儀表板和指導方針。 此網站適用於持續擴充的 Azure 服務子集,包括屬於 Azure 登陸區域 (ALZ) 的所有服務。

常見的警示結構描述會將 Azure 監視器警示通知的使用量標準化。 如需詳細資訊,請參閱一般警示結構描述 (機器翻譯)。

警示類型

您可以針對在 Azure 監視器資料平台中的任何計量或記錄資料來源發出警示。 警示有許多不同的類型,具體取決於您監視的服務以及所收集的監視資料。 不同類型的警示各有優缺點。 如需詳細資訊,請參閱選擇正確的監視警示類型 (機器翻譯)。

下列清單介紹可建立的 Azure 監視器警示類型:

  • 計量警示 (機器翻譯) 會定期評估資源計量。 這些計量可以是平台計量、自訂計量、Azure 監視器轉換成計量的記錄,或 Application Insights 計量。 計量警示還可以套用多個條件和動態閾值。
  • 記錄警示 (機器翻譯) 可讓使用者使用 Log Analytics 查詢,以預先定義的頻率評估資源記錄。
  • 活動記錄警示 (機器翻譯) 會在發生符合定義條件的新活動記錄事件時觸發。 資源健康狀態警示和服務健康情況警示是報告服務和資源健康狀態的活動記錄警示。

某些 Azure 服務也支援智慧偵測警示Prometheus 警示建議的警示規則

對於某些服務,若要進行大規模監控,您可以將同一計量警示規則套用至相同 Azure 區域中存在的多個同類型資源。 系統會針對每個受監視的資源傳送個別通知。 如需支援的 Azure 服務和雲端,請參閱使用一個警示規則監視多個資源 (機器翻譯)。

您可以建立單一多資源警示規則,套用至特定資源群組或訂用帳戶中在同一個區域內的所有 VM。 如需使用可用性計量的教學課程,請參閱建立 Azure 虛擬機器的可用性警示規則 (預覽)

從部分 Azure 服務,您可以啟用建議的現成警示規則

系統會編譯建議的警示規則清單,根據:

  • 資源提供者對於監視資源的重要訊號和臨界值的知識。
  • 告知我們客戶經常針對此資源發出警示的資料。

注意

建議的警示規則適用於:

  • 虛擬機器
  • Azure Kubernetes Service (AKS) 資源
  • Log Analytics 工作區

Azure VM 的建議警示規則包括 VM 可用性計量,這會在 VM 停止執行時發出警示。

如需更多資訊,請參閱教學課程:啟用 Azure 虛擬機器的建議警示規則

常見警示規則

若要查看 Azure 入口網站中的常見 VM 記錄警示規則,請移至 Log Analytics 中的 [查詢] 窗格。 在 [資源類型] 中,輸入 [虛擬機器],在 [類型] 中,輸入 [警示]

如需常見虛擬機警示規則的清單和討論,請參閱常見警示規則

Advisor 建議

對於一些服務,如果在資源作業期間發生重大狀況或有即將到來的變更,入口網站的服務 [概觀] 頁面上會顯示警示。 您可以在左側功能表中 [監視] 底下的 [Advisor 建議] 中找到警示的詳細資訊和建議的修正。 在正常作業期間,不會顯示 Advisor 建議。

如需 Azure Advisor 的詳細資訊,請參閱 Azure Advisor 概觀 (機器翻譯)。

其他 VM 監視選項

Azure VM 具有下列非 Azure 監視器監視選項:

開機診斷

開機診斷是 Azure VM 的偵錯功能,可讓您藉由收集 VM 啟動時的序列記錄資訊和螢幕快照來診斷 VM 開機失敗。 在 Azure 入口網站中建立 VM 時,預設會啟用開機診斷。 如需詳細資訊,請參閱 Azure boot-diagnostics

針對效能問題進行疑難排解

Performance Diagnostics 工具透過快速診斷和提供目前在機器上發現的問題深入解析,協助針對 Windows 或 Linux 虛擬機器上的效能問題進行疑難排解。 此工具不會分析您所收集的歷史監視資料,而是檢查機器目前狀態是否有已知問題、實作最佳做法,以及涉及 VM 效能緩慢或 CPU、磁碟空間或記憶體使用量過高的複雜問題。