Operations Manager 重要概念

重要

此版本的 Operations Manager 已終止支援。 建議您 升級至 Operations Manager 2022

Operations Manager 軟體是 Microsoft System Center 的元件,它能協助您從單一主控台監視許多電腦的服務、裝置與運作狀態。 本文說明管理 Operations Manager 基礎結構之系統管理員的 Operations Manager 基本概念,以及監視及支援您企業 IT 服務的操作員。

Operations Manager 的功用為何

不論小型企業或大型企業,一般都需要仰賴運算環境提供的服務和應用程式。 IT 部門負責確保這些重要服務和應用程式的效能和可用性。 這表示 IT 部門必須知道何時發生問題、找出問題的位置,並找出造成問題的原因,最好在應用程式的使用者遇到問題之前。 企業中的計算機和裝置越多,這項工作就越具挑戰性。

在環境中使用 Operations Manager 能簡化眾多電腦、裝置、服務和應用程式的監視作業。 下圖所示的 Operations 控制台可讓您檢查環境中所有受監視物件的健全狀況、效能和可用性,並協助您找出並解決問題。

Operations 控制台的螢幕快照。

注意

若要深入了解 Operations Manager 主控台,請參閱《操作指南》中的比較 Operations Manager 主控台

Operations Manager 會告訴您哪些受監視的對象狀況不良、在識別問題時傳送警示,並提供資訊來協助您識別問題的原因和可能的解決方案。 如果您是系統管理員,可以藉由選取要監視的電腦和裝置,以及匯入為特定功能和應用程式提供監視功能的管理組件來設定要監視的項目。 若要決定要監視的物件和要監視的狀況,您需要瞭解構成 Operations Manager 基礎結構的功能和 Operations Manager 的運作方式。

Operations Manager 基礎結構

安裝 Operations Manager 會建立「管理群組」。 管理群組是基本的功能單位。 管理群組至少由一部「管理伺服器」 、「操作資料庫」 和「報表資料倉儲資料庫」 所組成。

  • 「管理伺服器」 是掌管管理群組以及與資料庫通訊的焦點。 當您開啟 Operations 主控台並連線到管理群組時,實際上是連線到該管理群組的管理伺服器。 由於運算環境的大小不盡相同,管理群組可能會包含一部或多部管理伺服器。

  • 「操作資料庫」 是 SQL Server 資料庫,它含有管理群組的所有設定資料,也能儲存所有為管理群組收集和處理的監視資料。 操作資料庫會保存短期資料,預設為 7 天。

  • 「資料倉儲資料庫」 是 SQL Server 資料庫,它能儲存監視和警示資料以供追溯歷程之用。 寫入 Operations Manager 資料庫的資料也會寫入資料倉儲資料庫,因此報表一律包含最新的資料。 資料倉儲資料庫會保存長期資料。

安裝 Operations Manager 報告功能時,管理群組也會包含報表伺服器,該 伺服器會從數據倉儲資料庫中的數據建置和呈現報表。

管理群組的核心元件可以位在單一伺服器上或分散在多部伺服器上,如下圖所示。

基本管理群組的圖例。

如需安裝管理群組功能的詳細資訊,請參閱 Operations Manager 部署指南

管理伺服器

管理伺服器的角色負責掌管管理群組設定、管理代理程式及與其通訊,以及與管理群組中的資料庫通訊。

管理群組可包含多部管理伺服器,以提供額外的容量和不間斷的可用性。 當您將兩部或多部管理伺服器加入管理群組時,管理伺服器便成為「資源集區」 的一部分,而工作量則會分散到集區的成員上。 當資源集區的成員失敗時,資源集區中的其他成員將會接管該成員的工作負載。 新增管理伺服器時,新的管理伺服器會自動從資源集區中的現有成員挑選一些工作。 資源集區中的所有成員都會管理一組不同的遠程物件;在任何指定時間,相同集區中的兩個成員不會同時管理相同的物件。

「閘道伺服器」 是特殊的管理伺服器類型。 閘道伺服器可讓您監視未受信任網域中的電腦。 如需詳細資訊,請參閱規劃管理群組設計

代理程式

Operations Manager「代理程式」 是安裝在電腦上的服務。 代理程式會收集數據、比較範例數據與預先定義的值、建立警示,以及執行回應。 管理伺服器會接收設定,並將設定散發給受監視電腦上的代理程式。

每個代理程式都會向管理群組中的管理伺服器報告。 此管理伺服器稱為代理程式的主要管理伺服器。

代理程式可監看受監視電腦上的資料來源,以及根據管理伺服器傳送給它的設定來收集資訊。 代理程式也能計算受監視電腦和受監視電腦上物件的健全狀況狀態,然後再向管理伺服器回報。 當受監視物件的健全狀況狀態變更或其他準則符合時,可以從代理程序產生警示。 如此可讓操作員知道有問題需要處理。 藉由將受監視物件的健全狀況資料提供給管理伺服器,代理程式可提供裝置和其裝載的所有應用程式的最新健全狀況。

您可以設定代理程式作為「Proxy 代理程式」 。 Proxy 代理程式是代替主機電腦之外的電腦或網路裝置,將資料轉寄給管理伺服器的代理程式。 例如,您可以使安裝在 SQL 叢集實體節點上的代理程式成為 Proxy,以便監視叢集資源。 Proxy 代理程式可監視無法安裝代理程式的電腦和裝置。 如需詳細資訊,請參閱 Agentless Monitoring (無代理程式監視)

服務

在受監視的電腦上,Operations Manager 代理程式會列為 Microsoft Monitoring Agent 服務。 Microsoft Monitoring Agent 服務會收集效能資料、執行工作等。 即使當服務無法與報告的管理伺服器通訊時,它仍會繼續執行並將收集到的資料和事件佇列在受監視電腦的磁碟上。 當連線恢復後,Microsoft Monitoring Agent 服務便會將收集的資料和事件傳送給管理伺服器。

注意

Microsoft Monitoring Agent 服務有時稱為「健全狀況服務」。

Microsoft Monitoring Agent 服務也會在管理伺服器上執行。 在管理伺服器上,此服務會執行監視工作流程及管理認證。 為了執行工作流程,此服務會使用指定的認證起始 MonitoringHost.exe 處理序。 這些處理序會監視和收集事件記錄資料、效能計數器資料、Windows Management Instrumentation (WMI) 資料,以及執行如指令碼等動作。

管理伺服器還會執行 System Center 資料存取服務和 System Center 管理設定服務。

System Center 資料存取服務會將操作資料庫的存取權限提供給 Operations 主控台,以及將資料寫入資料庫。

System Center 管理設定服務可管理管理群組的關聯性和拓撲。 它也能將管理組件散發給受監視的物件。

管理組件

System Cente 管理服務執行的工作流程是由「管理組件」 所定義的。 管理組件可定義代理程式針對特定應用程式或技術而收集的資訊,以及傳回給管理伺服器的資訊。 例如,BizTalk Server 管理組件包含的規則和監視可收集和評估確保 BizTalk Server 應用程式健全狀況和效率的重要事件和操作。

當 Operations Manager 在電腦上安裝代理程式後,它會傳送初始設定給代理程式。 初始設定包括來自管理組件的「物件探索」 。 管理元件會定義物件類型,例如將在 Operations Manager 探索到的電腦上監視的應用程式和功能。 代理程式會將在電腦上探索到的物件執行個體的識別資料傳送給管理伺服器。 管理伺服器接著會將適用於每部電腦上已探索物件的管理組件元素 (如規則和監視) 傳送給代理程式。

規則會定義要從計算機收集的事件和效能數據,以及在收集資訊之後該怎麼做。 簡單來說,我們可以將規則視為「若/則」陳述式。 例如,應用程式的管理組件可能包含如下所示的規則:

  • 如果指出應用程式即將關閉的訊息出現在事件記錄檔中,則建立警示。

  • 如果來源檔案上傳失敗,請收集指出此失敗的事件。

如以上範例所示,規則可建立警示及收集事件或效能資料 (亦即代理程式傳送給管理伺服器的內容)。 規則也可執行指令碼,例如允許某個規則嘗試重新啟動失敗的應用程式。

已探索的物件會有健全狀況狀態,這些狀態反映在 Operations 主控台內會是綠色 (成功或狀況良好)、黃色 (警告) 或紅色 (重大或狀況不良)。 「監視」 會定義受監視物件某些層面的健全狀況狀態。 例如,磁碟機容量的監視可能會將低於 85% 的已滿程度定義為綠色、將超過 85% 的已滿程度定義為黃色,並將超過 90% 的已滿程度定義為紅色。 您可以將監視設定成在發生狀態變更時產生警示。

物件的探索和監視方式

下圖是探索和監視物件的方式的簡要說明。

探索和監視概觀的圖例。

  1. 系統管理員設定 Operations Manager 以搜尋要管理的電腦。 如需探索電腦的詳細資訊,請參閱代理程式部署規劃

  2. 識別符合指定準則且尚未受管理的計算機。

  3. 系統將 Operations Manager 代理程式安裝在探索到的電腦上。

  4. 代理程式會要求設定數據,然後管理伺服器會從已安裝的管理元件傳送代理程式組態數據,其中包含要探索的類別。 例如,如果您已安裝 Windows Server 作業系統管理組件,管理伺服器會將作業系統類別傳送給代理程式。

  5. 代理程式比對設定資料和電腦、識別探索到的任何物件,然後將資訊傳回給管理伺服器。 例如,代理程式會回到計算機上 Windows Server 2019 操作系統實例所在的管理伺服器。

  6. 管理伺服器會從套用至所探索物件的已安裝管理元件傳送代理程式的所有監視邏輯。 例如,代理程式會收到適用於 Windows Server 2019 的所有監視邏輯。

  7. 代理程式套用監視邏輯 (如規則和監視)、執行工作流程,以及將資料傳回給管理伺服器。

  8. 當探索到的對象發生變更時,例如要新增或卸載的應用程式,代理程式會將更新的資訊傳送至管理伺服器,然後傳送更新的監視邏輯。

注意

Operations Manager 也可以探索及監視網路裝置、執行 UNIX 的電腦和 Linux 操作系統,並提供無代理程序監視。 如需詳細資訊,請參閱操作指南中的 Operations Manager Monitoring Scenarios (Operations Manager 監視案例)

代理程式與管理伺服器之間的通訊

Operations Manager 代理程式會傳送警示和探索資料到主要管理伺服器,由後者將資料寫入操作資料庫。 代理程式也會傳送事件、效能和狀態資料到該代理程式的主要管理伺服器,再由後者將資料同時寫入操作和資料倉儲資料庫。

代理程式會根據每個規則和監視的排程參數來傳送資料。 使用最佳化集合規則時,只有當計數器的取樣與先前取樣之差異達到指定的容錯 (如 10%) 時,才會傳輸資料。 這將有助於減少網路流量,以及儲存在操作資料庫中的資料量。

此外,所有代理程式都會將稱為「活動訊號」 的資料封包,定期 (預設為每 60 秒) 傳送到管理伺服器。 傳送活動訊號的目的是要驗證代理程式以及代理程式與管理伺服器之間通訊的可用性。 如需活動訊號的詳細資訊,請參閱 How Heartbeats Work in Operations Manager (活動訊號在 Operations Manager 中的運作方式)

Operations Manager 會針對每個代理程式執行「健全狀況服務監看員」 ,這項功能會從管理伺服器的角度,監視遠端健全狀況服務。

Operations Manager 的其他資源