雲端監視平臺概觀

本文是雲端監視指南系列文章的一部分。

Microsoft 提供多個產品的一系列雲端監視功能:

這些供應專案提供核心監視服務,例如警示、服務運行時間追蹤、應用程式和基礎結構健康情況監視、診斷和分析。

下列各節提供監視平臺的高階概觀,協助您瞭解每個平臺如何提供核心監視功能。

基礎結構需求

Operations Manager

Operations Manager 需要重要的基礎結構和維護,才能支援管理群組,這是基本的功能單位。 至少,管理群組包含一或多個管理伺服器、SQL Server 實例、裝載作業和報告數據倉儲資料庫,以及代理程式。 管理群組設計的複雜性取決於多種因素,例如要監視的工作負載範圍,以及支援工作負載的裝置或計算機數目。 如果您需要高可用性和月臺復原,與企業監視平台的情況一樣,基礎結構需求和相關聯的維護可能會大幅增加。

Diagram of Operations Manager management group

Azure 監視器 SCOM 受控執行個體

Azure 監視器 SCOM 受控執行個體 是裝載在 Azure 中的 System Center Operations Manager PaaS 供應專案。 SCOM 受控執行個體 需要最少的基礎結構和維護,因為許多基礎結構元件,例如管理伺服器和資料庫裝載在 Azure 中,並由 Microsoft 管理;您不再需要負責使用最新的升級和功能來修補管理伺服器和資料庫。 此外,您可以在按鍵時調整管理伺服器。

Diagram of Operations Manager Managed Instance architecture..

Azure 監視器

Azure 監視器是軟體即服務 (SaaS) 供應專案,因此其支援的基礎結構會在 Azure 中執行,並由 Microsoft 管理。 它會大規模執行監視、分析和診斷。 其適用於所有國家/地區雲端。 支援 Azure 監視器的基礎結構(收集器、計量和記錄存放區和分析)的核心部分是由 Microsoft 維護。

Diagram of Azure Monitor

資料集合

Operations Manager 和 SCOM 受控執行個體

客服專員

Operations Manager 只會從安裝在 Windows 電腦上的代理程式收集數據。 它可以接受來自 Operations Manager SDK 的數據,但這種方法通常用於使用自定義應用程式擴充產品的合作夥伴,而不是用於收集監視數據。 它可以使用在遠端訪問這些其他裝置之 Windows 代理程式上執行的特殊模組,從其他來源收集數據,例如 Linux 計算機 和網路裝置。

注意

SCOM 受控執行個體 只能從 Windows 電腦上的代理程式收集數據。

Diagram of Operations Manager agent

Operations Manager 代理程式可以從本機計算機收集數據,例如事件記錄檔、自定義記錄檔和性能計數器。 它也可以執行腳本,從本機計算機或外部來源收集數據。 您可以撰寫自定義腳本,以收集其他方式無法收集的數據,或從無法監視的各種遠端裝置收集數據。

管理元件

Operations Manager 會使用工作流程執行所有監視(規則、監視器和物件探索)。 這些工作流程會封裝在管理元件,並部署到代理程式。 管理元件適用於各種產品和服務,其中包括預先定義的規則和監視器。 您也可以為應用程式和自定義案例撰寫自己的管理元件。

監視設定

管理元件可以包含數百個規則、監視器和物件探索規則。 代理程式會從套用的所有管理元件執行所有這些監視設定,這些設定是由探索規則決定。 每個監視設定的每個實例都會獨立執行,並立即針對所收集的數據執行。 這是 Operations Manager 如何達成近乎即時的警示,以及受監視資源的目前健全狀態。

例如,監視器可能會每隔幾分鐘取樣性能計數器。 如果該計數器超過臨界值,它會立即設定其目標物件的健全狀態,這會立即觸發管理群組中的警示。 排程規則可能會監看要建立的特定事件,並在本機事件記錄檔中建立該事件時立即引發警示。

由於這些監視設定彼此隔離,而且會與個別數據源一起運作,因此 Operations Manager 在多個來源之間有相互關聯數據的挑戰。 收集數據之後,也很難對數據做出反應。 您可以執行可存取 Operations Manager 資料庫的工作流程,但此案例很少見,而且通常用於有限數目的特殊用途工作流程。

Diagram of Operations Manager management group

Azure 監視器

資料來源

Azure 監視器會從各種來源收集數據,包括 Azure 平台記錄、Azure 活動記錄、資源記錄、Azure 監視器代理程式 (AMA)在 Azure 和混合式虛擬機的客體操作系統上,以及來自 Azure 中資源的診斷數據。 任何 REST 用戶端都可以使用 API 將記錄數據寫入 Azure 監視器,而且您可以定義 Web 應用程式的自定義計量。 視使用量而定,某些計量數據可以路由傳送至不同的位置。 例如,您可以使用數據來「儘快」警示或長期趨勢分析搜尋與其他記錄數據。

監視深入解析

深入解析,例如 Application Insights、Azure Container insights 和 Azure VM 深入解析,使用 Azure 監視器的記錄和計量平臺,為 Azure 入口網站 中的應用程式或服務提供自定義的監視體驗。 它們可能會提供健康情況監視和警示條件,以及所收集數據的自定義分析。

監視設定

Azure 監視器會將數據收集與針對該數據採取的動作分開,該數據支援雲端環境中的分散式微服務。 它會將數據從多個來源合併到通用數據平臺,並根據收集的數據提供分析、視覺效果和警示功能。

Azure 監視器收集的數據會儲存為記錄或計量,而 Azure 監視器的不同功能則依賴其中之一。 計量包含時間序列中的數值,非常適合近乎即時的警示和快速偵測問題。 記錄包含文字或數值數據,而且可以使用有助於執行複雜分析的強大語言來查詢。

因為 Azure 監視器會將數據收集與針對該數據的動作分開,因此在許多情況下可能無法提供近乎即時的警示。 若要對記錄數據發出警示,查詢會以警示中定義的週期性排程執行。 此行為可讓 Azure 監視器快速讓所有受監視來源的數據相互關聯,而且您可以透過各種方式以互動方式分析數據。 這特別有助於根本原因分析和識別問題可能發生的位置。

健康狀態監視

Operations Manager 和 SCOM 受控執行個體

Operations Manager 中的管理元件包含服務模型,描述所監視之應用程式的元件及其關聯性。 監視器會根據代理程式上的數據和腳本,識別每個元件的目前健全狀態。 健全狀況狀態匯總,讓您可以快速檢視受監視計算機和應用程式的摘要健康情況狀態。

Azure 監視器

Azure 監視器不會提供用戶可定義的方法來實作服務模型或監視器,指出任何服務元件目前的健全狀態。 Azure 監視器的下列功能很有説明:

  • Application Insights 建置 Web 應用程式的複合對應,併為每個應用程式元件或相依性提供健康情況狀態。 這包括警示狀態,以及向下切入至應用程式的詳細診斷。

  • Azure VM 深入解析 監視虛擬機和虛擬機擴展集的效能和健康情況。 使用 Azure VM Insights 監視執行中的進程和相依性,並提供可預測的效能和可用性趨勢。 您也可以透過 應用程式變更分析 監視資源的變更,以瞭解虛擬機是否有任何變更會影響其效能。

  • Azure Container Insights監視 Azure Kubernetes Service 或 Azure 容器執行個體 的效能和健康情況。 它會透過計量 API 從 Kubernetes 中提供的控制器、節點和容器收集記憶體和處理器計量。 它也會收集容器記錄和有關容器及其映像的清查數據。 以所收集效能數據為基礎的預先定義健康情況準則可協助您識別資源瓶頸或容量問題是否存在。 您也可以瞭解特定 Kubernetes 物件類型的整體效能或效能(Pod、節點、控制器或容器)。

分析資料

Operations Manager 和 SCOM 受控執行個體

Operations Manager 提供下列基本方式,以在收集數據之後進行分析:

  • 健全狀況總管: 協助您探索哪些監視器識別健康情況狀態問題,並檢閱監視的相關知識,以及相關動作的可能原因。

  • 報表: 可讓您摘要儲存在 Operations Manager 數據倉儲中的歷程記錄數據。 您可以自定義檢視和報表所依據的數據。 若要深入瞭解,請參閱在 Operations Manager 中使用報表工作區和 在 Power BI 上建立報表

  • Operations Manager 命令殼層: 使用另一組 Cmdlet 擴充 Windows PowerShell,並可查詢和可視化收集的數據。 這包括使用PowerShell或 Operations Manager HTML 型 Web 控制台原生的圖形和其他視覺效果。

Azure 監視器

使用功能強大的 Azure 監視器分析引擎,您可以互動方式處理記錄數據,並將它們與其他監視數據結合,以進行趨勢和其他數據分析。 檢視和儀錶板可讓您從 Azure 入口網站 以各種方式可視化查詢數據,並將其匯入 Power BI。 Application Insights、Azure VM 深入解析和 Azure Container Insights 等深入解析包含自定義的視覺效果,以支援互動式監視案例。

Azure 監視器支援數種方式來分析和可視化數據,包括下列專案:

  • 計量瀏覽器
  • Log Analytics
  • Azure 活頁簿
  • Azure 儀表板
  • Grafana
  • Power BI
  • Azure 監視器合作夥伴整合

若要深入瞭解,請參閱 分析和可視化監視數據

警示

Operations Manager 和 SCOM 受控執行個體

Operations Manager 會建立警示,以響應預先定義的事件、符合效能閾值,以及受監視元件的健康情況狀態何時變更。 其中包含警示的完整管理,可讓您設定其解決方式,並將其指派給各種操作員或系統工程師。 您可以設定通知規則,以指定哪些警示會傳送主動式通知。

管理元件包含各種預先定義的警示規則,適用於受監視之應用程式中的不同重大狀況。 您可以調整這些規則,或建立自定義規則以符合您環境的特定需求。

Azure 監視器

透過 Azure 監視器,您可以根據超出閾值的計量或根據排程的查詢結果來建立警示。 Azure 監視器中的記錄查詢警示可讓您分析儲存在多個工作區中的所有數據。 這些警示也包含來自使用跨工作區查詢之特定 Application Insights 應用程式的數據。

Azure 監視器支持無狀態和具狀態警示:

  • 每次符合條件時都會引發無狀態警示,即使先前已引發也一樣。
  • 符合條件時會引發具狀態警示,然後在解決條件之前不要再次引發或觸發。

工作流程

Operations Manager 和 SCOM 受控執行個體

Operations Manager 中的管理元件包含數百個個別工作流程,並決定要收集的數據,以及使用該數據執行的動作。 例如,規則可能會每隔幾分鐘取樣性能計數器,以儲存其結果進行分析。 監視器可能會取樣相同的性能計數器,並將其值與臨界值進行比較,以判斷受監視物件的健全狀態。 另一個規則可能會執行腳本來收集和分析代理程式計算機上的某些數據,然後在傳回特定值時引發警示。

Operations Manager 中的工作流程彼此獨立,可讓多個受監視物件的分析變得困難。 這些監視案例必須以收集之後的數據為基礎,這是可能的,但可能很困難且罕見。

Azure 監視器

Azure 監視器會將數據收集與從該數據採取的動作和分析分開。 代理程式和其他數據源會將記錄數據寫入Log Analytics工作區,並將計量數據寫入計量資料庫,而不需要分析該數據或瞭解其使用方式。 監視會從儲存的數據執行警示和其他動作,讓您分析來自所有來源的數據。

擴充基底平臺

Operations Manager 和 SCOM 受控執行個體

Operations Manager 會在管理元件中實作所有監視邏輯,您自行建立或從合作夥伴或我們取得該邏輯。 當您安裝管理元件時,它會在不同的代理程式上自動探索應用程式或服務的元件,並部署適當的規則和監視器。 管理元件包含健全狀況定義、警示規則、效能和事件收集規則,以及檢視,以提供支援基礎結構服務或應用程式的完整監視。

Operations Manager SDK 可讓 Operations Manager 與第三方監視平臺或 IT 服務管理 (ITSM) 軟體整合。 某些合作夥伴管理元件也會使用 SDK 來支援監視網路裝置,並提供自定義簡報體驗,例如 Squared Up HTML5 儀錶板或與 Microsoft Office Visio 整合。

Azure 監視器

Azure 監視器會從 Azure 資源收集計量和記錄,幾乎不需要設定。 Application Insights 和 Azure VM 深入解析等深入解析會使用 Azure 監視器平臺來收集數據和處理。 它們也會提供其他工具來可視化和分析數據。 您可以使用核心 Azure 監視器功能,例如記錄查詢和警示,將深入解析所收集的數據與其他數據結合。

監視器支持數種方法,從 Azure 或外部資源收集監視或管理數據。 然後,您可以將數據從計量或記錄存放區擷取並轉送至 ITSM 或監視工具。 或者,您可以使用 Azure 監視器 REST API 來執行系統管理工作。

下一步