共用方式為


監視 Azure Service Fabric

本文章說明:

  • 您可以為此服務收集的監視資料類型。
  • 分析資料的方式。

注意

如果您已經熟悉此服務和/或 Azure 監視器,只想知道如何分析監視資料,請參閱本文靠近結尾的分析一節。

當您有依賴 Azure 資源的重要應用程式和商務流程時,就需要監視並取得系統的警示。 Azure 監視器服務會從您系統的每個元件收集及彙總計量和記錄。 Azure 監視器讓您能夠檢視可用性、效能及復原能力,並在發生問題時通知您。 您可以使用 Azure 入口網站、PowerShell、Azure CLI、REST API 或用戶端程式庫來設定及檢視監視資料。

Azure Service Fabric 監視

Azure Service Fabric 具有您可以監視的下列層級:

  • 應用程式監視:節點上執行的應用程式。 您可以使用 Application Insights 金鑰或 SDK、EventStore 或 ASP.NET Core 記錄來監視應用程式。
  • 平台 (叢集) 監視:平台或叢集節點的用戶端計量、記錄和事件,包括容器計量。 Linux 或 Windows 節點的計量和記錄不同。
  • 基礎結構 (效能) 監視:服務基礎結構的服務健康情況和效能計數器。

您可以監視應用程式被使用的方式、由 Service Fabric 平台所採取的動作、搭配效能計數器的資源使用量,以及叢集的整體健康情況。 Azure 監視器記錄Application Insights 提供與 Service Fabric 的內建整合。

Service Fabric Explorer

Service Fabric Explorer 是適用於 Windows、macOS 和 Linus 的桌面應用程式,提供可檢查及管理 Azure Service Fabric 叢集的開放原始碼工具。 若要啟用自動化,可以透過 Service Fabric 總管執行的每個動作也都可以透過 PowerShell 或 REST API 執行。

應用程式監視

應用程式監視會追蹤您應用程式的功能與元件使用情況。 您可以監視應用程式,以確定找出影響使用者的問題。 應用程式監視的責任會落在開發應用程式及其服務的使用者身上,因為它會專屬於您應用程式的商務邏輯。 在下列情況,監視應用程式可能非常有用:

  • 我的應用程式正在處理多少流量? - 您是否需要調整服務以符合使用者需求,或解決應用程式中的潛在瓶頸?
  • 服務對服務呼叫是否成功且順利被追蹤?
  • 我應用程式的使用者採取了哪些動作? - 收集遙測可協助引導未來的功能開發,並對應用程式錯誤進行更佳的診斷
  • 我的應用程式是否正在擲回未處理的例外狀況?
  • 在我容器中執行的服務之內正在發生什麼事?

應用程式監視的好處,在於開發人員可以自由使用任何工具和架構,因為應用程式監視是存在於您應用程式的內容之內! 若要深入了解適用於搭配 Azure 監視器 Application Insights 進行應用程式監視的 Azure 解決方案,請參閱使用 Application Insights 進行事件分析

我們也有提供如何針對 .NET 應用程式設定此功能的教學課程。 此教學課程會說明如何安裝正確的工具、提供在應用程式中撰寫自訂遙測的範例,以及說明如何在 Azure 入口網站中檢視應用程式診斷及遙測。

應用程式記錄

檢測程式碼不僅是深入了解您的使用者的一種方式,也是了解應用程式中是否存在問題,以及診斷需要修正問題之內容的唯一方法。 雖然技術上可以將偵錯工具連線至生產服務,但這不是常見的做法。 因此,取得詳細的檢測資料很重要。

某些產品會自動檢測您的程式碼。 雖然這些產品的效果不錯,但幾乎都還是需要手動檢測才能專屬於您的商務邏輯。 最後您還是要有足夠資訊,才能以抽絲剝繭的方式對應用程式進行偵錯。 Service Fabric 應用程式可以使用任何記錄架構進行檢測。 本節說明一些不同的程式碼檢測方法,以及在何種情況下應選擇什麼方法。

  • Application Insights SDK:Application Insights 與 Service Fabric 已有現成的豐富整合。 使用者可以新增 AI Service Fabric nuget 套件,接收在 Azure 入口網站中建立並收集的可檢視資料和記錄。 此外,也建議使用者新增他們自己的遙測,用來診斷和偵錯他們的應用程式,以及追蹤應用程式的哪些服務和功能最常使用。 SDK 中的 TelemetryClient 類別提供許多追蹤應用程式遙測的方式。 如需更多資訊,請參閱使用 Application Insights 進行事件分析和視覺效果

    請看監視與診斷 .NET 應用程式教學課程中的範例,了解如何檢測 Application Insights 以及將其加入應用程式。

  • EventSource:當您在 Visual Studio 中從範本建立 Service Fabric 解決方案時,將會產生 EventSource 衍生類別 (ServiceEventSourceActorEventSource)。 建立的範本可讓您為應用程式或服務新增事件。 EventSource 名稱必須是獨一無二,並應該將預設範本字串 MyCompany-<solution>-<project> 重新命名。 多個同名的 EventSource 定義會導致執行階段發生問題。 每個已定義事件都必須有獨一無二的識別碼。 如果識別碼並非獨一無二,會發生執行階段失敗。 有些組織會預先指派識別碼的值範圍,以避免不同開發小組之間用法不一致。 如需詳細資訊,請參閱 Vance 的部落格MSDN 文件

  • ASP.NET Core 記錄:必須仔細規劃您檢測程式碼的方式。 正確規劃檢測有助於避免可能使程式碼基底不穩定,導致需要重新檢測程式碼。 為了降低風險,開發人員可以選擇檢測程式庫,例如 Microsoft ASP.NET Core 中的 Microsoft.Extensions.Logging。 ASP.NET Core 提供 ILogger 介面,可搭配您選擇的提供者一起使用,讓現有程式碼所受的影響降到最低。 您可以在 Windows 和 Linux 上使用 ASP.NET Core 中的程式碼,也可以使用完整 .NET Framework 中的程式碼,使檢測程式碼標準化。

如需有關如何使用這些建議的範例,請參閱 在您的 Service Fabric 應用程式中新增記錄

平台 (叢集) 監視

使用者可以控制應用程式會傳送哪些遙測,因為程式碼本身是使用者所撰寫的。但是來自 Service Fabric 平台的診斷又如何? Service Fabric 的其中一個目標是讓應用程式在硬體失敗時能夠復原。 這個目標可以透過 平台的系統服務偵測基礎結構問題,並快速地將工作負載容錯移轉到叢集中的其他節點來達成。 但是在這個特殊情況下,如果是系統服務本身有問題,會發生什麼情況? 或如果在嘗試部署或移動工作負載時違反了設置服務的規則,會發生麼情況? Service Fabric 能針對這些及其他情況提供診斷,以確保您能夠了解在您叢集中所發生的活動。 叢集監視的一些範例案例包括:

如需平台 (叢集) 監視的詳細資訊,請參閱監視叢集

Service Fabric 事件

Service Fabric 提供一組現成可用的診斷事件,您可以透過 EventStore 或平台公開的作業事件通道進行存取。 這些 Service Fabric 事件會說明平台針對各種不同的實體 (例如節點、應用程式、服務和分割區) 所執行的動作。 Windows 和 Linux 叢集上都會提供相同的事件。

  • Service Fabric 事件通道:在 Windows 上,透過一組用於挑選「作業和資料」與「傳訊」通道相關的 logLevelKeywordFilters,就能從單一 ETW 提供者取得 Service Fabric 事件。 這是我們視需要分隔出要篩選之傳出 Service Fabric 事件的方式。 在 Linux 上,Service Fabric 事件會經過 LTTng 並放入一個儲存體資料表,您可以視需要從這個資料表篩選事件。 這些通道包含經過策劃、結構化的事件,可用來進一步了解您的叢集狀態。 叢集建立時預設會啟用診斷,這會建立一個 Azure 儲存體表格,來自這些通道的事件會傳送到這個表格,供您將來查詢之用。

  • EventStore 是一項功能,可透過 Service Fabric 用戶端程式庫 REST API 在 Service Fabric 總管中以程式設計的方式顯示 Service Fabric 平台事件。 您可以看到快照集檢視,其中顯示每個節點、服務和應用程式在叢集中發生的情況,並根據事件的時間進行查詢。 EventStore API 僅適用於在 Azure 上執行的 Windows 叢集。 在 Windows 電腦上,這些事件會饋送至 EventLog,因此您可以在事件檢視器中看到 Service Fabric 事件。

螢幕擷取畫面顯示 [節點] 窗格數個事件的 [事件] 索引標籤,包括 NodeDown 事件。

所提供的診斷預設便是以一組詳盡事件的形式提供。 這些 Service Fabric 事件能說明平台針對各種不同的實體 (例如節點、應用程式、服務、分割區等) 所執行的動作。在上述的最後一個案例中,如果節點發生故障,平台將會發出 NodeDown 事件,且您所選擇的監視工具將會立即通知您。 其他常見的範例包括容錯移轉期間的 ApplicationUpgradeRollbackStartedPartitionReconfiguredWindows 和 Linux 叢集上都會提供相同的事件。

這些事件會透過 Windows 和 Linux 上的標準通道傳送,並可由任何支援這些通道的監視工具讀取。 Azure 監視器的解決方案是 Azure 監視器記錄。 歡迎深入了解我們的 Azure 監視器記錄整合,其中包含適用於您叢集的自訂作業儀表板,以及可用來建立警示的一些範例查詢。 如需更多叢集監視概念,請參閱平台層級事件和記錄產生

健康狀態監視

Service Fabric 平台包括健康情況模型,針對叢集中的實體狀態提供可延伸的健康情況報告。 每個節點、應用程式、服務、分割區、複本或執行個體,都有可持續更新的健康情況狀態。 健康情況狀態可以是「良好」、「警告」或「錯誤」。 您可以將 Service Fabric 事件想成從叢集到各種實體的「動詞」,並將健康情況想成針對每個實體的「形容詞」。 每當某個實體的健康情況轉換時,系統也會發出事件。 如此一來,您便可以使用和其他事件相同的方式,在自己所選的監視工具中針對健康情況事件設定查詢和警示。

此外,我們還會讓使用者覆寫實體的健康情況。 如果您在應用程式升級後遇到驗證測試失敗的問題,您可以使用健康情況 API 寫入 Service Fabric 健康情況,以表明應用程式的健康情況已不再良好,而 Service Fabric 將會自動復原該升級! 如需健康情況模型的詳細資訊,請參閱 Service Fabric 健康情況監視簡介

SFX 健康情況儀表板的螢幕擷取畫面。

監視程式

一般而言,監視程式是一個單獨的服務,可以觀察服務之間的健康情況和負載、偵測端點,並回報叢集中非預期的健康情況事件。 這可以避免在單一服務效能中無法偵測到的錯誤。 監視程式也很適合裝載程式碼,以執行不需要使用者互動的補救動作,例如依特定間隔時間清除儲存體中的記錄檔。 如果想要有完整實作的開放原始碼 SF 監視程式服務,其中包含易於使用的監視程式擴充性模型,而且在 Windows 和 Linux 叢集上執行,請參閱 FabricObserver 專案。 FabricObserver 是生產就緒的軟體。 建議將 FabricObserver 部署到測試和生產叢集,然後透過其外掛程式模型,或派生並撰寫您自己的內建觀察者,加以延伸來滿足您的需求。 前者 (外掛程式) 是建議的方法。

基礎結構 (效能) 監視

我們已經涵蓋了應用程式及平台中的診斷,那麼又要如何得知硬體已正確運作? 監視根本的基礎結構是了解叢集狀態和資源使用率的關鍵部分。 測量系統效能需要仰賴許多會因工作負載不同而變動的因素。 這些因素通常是透過效能計數器來測量。 這些效能計數器可能會來自各種不同的來源,包括作業系統、.NET 架構,或是 Service Fabric 平台本身。 適用它們的一些案例為

  • 我是否正在有效地使用我的硬體? 您想要使 CPU 的運作率達 90% 或 10%。 這在調整您的叢集,或是對您應用程式的處理序進行最佳化時很有用。
  • 我是否能主動預測基礎結構問題? 許多問題在發生之前,效能會有突然的變化 (降低),因此您可以使用如網路 I/O 和 CPU 使用率等效能計數器,來主動地預測和診斷問題。

您可以在效能計量找到在基礎結構層級應該收集的效能計數器清單。

建議使用 Azure 監視器記錄來監視叢集層級事件。 在工作區中設定 Log Analytics 代理程式之後,您就可以收集:

  • 效能計量,例如 CPU 使用率。
  • .NET 效能計數器,例如程序層級 CPU 使用率。
  • Service Fabric 效能計數器,例如來自可靠服務的例外狀況數目。
  • 容器計量,例如 CPU 使用率。

資源類型

Azure 會使用資源類型和識別碼的概念來識別訂用帳戶中的所有內容。 資源類型也是 Azure 中所執行每個資源的資源識別碼組成部分。 例如,虛擬機器的一種資源類型是 Microsoft.Compute/virtualMachines。 如需服務及其相關聯資源類型的清單,請參閱資源提供者 (機器翻譯)。

Azure 監視器同樣會依據資源類型將核心監視資料組織成計量和記錄,也稱為命名空間。 不同的計量和記錄適用於不同的資源類型。 您的服務可能會與多個資源類型相關聯。

如需適用於 Azure Service Fabric 的資源類型詳細資訊,請參閱 Service Fabric 監視資料參考

資料存放區

對於 Azure 監視器:

  • 計量資料會儲存在 Azure 監視器計量資料庫中。
  • 記錄資料會儲存在 Azure 監視器記錄存放區中。 Log Analytics 是可查詢此存放區的 Azure 入口網站工具。
  • Azure 活動記錄是個單獨存放區,其介面位於 Azure 入口網站。

您可選擇性地將計量和活動記錄資料路由傳送至 Azure 監視器記錄存放區。 然後,可以使用 Log Analytics 來查詢資料,並將其與其他記錄資料相互關聯。

許多服務可以使用診斷設定,將計量和記錄資料傳送至 Azure 監視器以外的其他儲存位置。 範例包括 Azure 儲存體、託管的合作夥伴系統以及使用事件中樞的非 Azure 合作夥伴系統

如需進一步了解 Azure 監視器如何儲存資料,請參閱 Azure 監視器資料平台

Azure 監視器平台計量

Azure 監視器為許多服務提供平台計量。 如需 Azure 監視器中所有資源可收集的計量完整清單,請參閱 Azure 監視器中所支援的計量

此服務不會收集平台計量。

非 Azure 監視器型計量

此服務提供 Azure 監視器計量資料庫中未包含的其他計量。

客體作業系統計量

在 Service Fabric 叢集節點上執行的客體作業系統 (OS) 計量,必須透過在客體作業系統上執行的一個或多個代理程式收集。 客體 OS 計量包括可追蹤客體 CPU 百分比或記憶體使用量的效能計數器,這兩者經常用於自動調整或警示。

最佳做法是使用與設定 Azure 監視器代理程式,將客體作業系統效能計量透過自訂計量 API 傳送至 Azure 監視器計量資料庫。 您也可以使用相同的代理程式,將客體作業系統計量傳送至 Azure 監視器記錄。 然後,您可以使用 Log Analytics 查詢這些計量和記錄。

注意

Azure 監視器代理程式會取代用於客體作業系統路由的 Azure 診斷延伸模組和 Log Analytics 代理程式。 如需詳細資訊,請參閱 Azure 監視器代理程式概觀 (機器翻譯)

Azure 監視器資源記錄

資源記錄提供對 Azure 資源所完成作業的深入解析。 系統會自動產生記錄,但您必須將其路由傳送至 Azure 監視器記錄,才能儲存或查詢這些記錄。 記錄會分成不同類別。 指定的命名空間可以有多個資源記錄類別供您收集。

此服務不會收集資源記錄,但您可以在從 Azure 資源監視資料中找到相關資訊。

Service Fabric 記錄和事件

Service Fabric 可以收集下列記錄:

  • 對於 Windows 叢集,您可以使用診斷代理程式Azure 監視器記錄設定叢集監視。
  • 對於 Linux 叢集,也建議以 Azure 監視器記錄為工具來監視 Azure 平台和基礎結構。 Linux 平台診斷需要不同的設定。 如需更多資訊,請參閱Syslog 中的 Service Fabric Linux 叢集事件
  • 您可以將 Azure 監視器代理程式設定為將客體作業系統記錄傳送至 Azure 監視器記錄,並可在其中使用 Log Analytics 查詢記錄。
  • 您可以將 Service Fabric 容器記錄寫入至 stdoutstderr,以讓 Azure 監視器記錄提供容器記錄。
  • 您可以設定 Azure 監視器記錄的容器監視解決方案,以檢視容器事件。

其他記錄解決方案

雖然我們建議兩個解決方案,但是 Azure 監視器記錄Application Insights 已內建在 Service Fabric 的整合中,所以許多事件會透過 ETW 提供者寫出來並可利用其他記錄解決方案延伸。 您也應該研究 Elastic Stack (尤其是當您考慮在離線環境中執行叢集時)、Dynatrace,或您偏好的其他任何平台。 如需已整合的合作夥伴清單,請參閱 Azure Service Fabric 監視合作夥伴

不論選擇何種平台,重點在於您對於其所提供的使用者介面、查詢能力、可用的自訂視覺化與儀表板,以及可強化監視體驗的其他工具所抱持的感受。

Azure 活動記錄 (部分機器翻譯)

活動記錄包含訂用帳戶層級事件,用於追蹤每個 Azure 資源外部可見的作業;例如,建立新的資源或啟動虛擬機器。

收集:活動記錄事件會自動產生並收集至個別存放區中,以便使用者在 Azure 入口網站中檢視。

路由:您可以將活動記錄資料傳送至 Azure 監視器記錄,以便與其他記錄資料一起分析。 您也可以使用其他位置,例如 Azure 儲存體、Azure 事件中樞及特定 Microsoft 監視合作夥伴。 如需路由傳送活動記錄的詳細資訊,請參閱 Azure 活動記錄概觀

分析監視資料

有許多工具可用來分析監視資料。

Azure 監視器工具

Azure 監視器支援下列基本工具:

支援更複雜視覺效果的工具包括:

  • 儀表板 (機器翻譯) 可讓您將不同類型的資料合併到 Azure 入口網站中的單一窗格。
  • 活頁簿 (機器翻譯) 是能在 Azure 入口網站中建立的可自訂報表。 活頁簿可以包含文字、計量及記錄查詢。
  • Grafana 是在操作儀表板中表現相當出色的開放平台工具。 您可以使用 Grafana 來建立儀表板,納入 Azure 監視器以外多個來源的資料。
  • Power BI (機器翻譯) 是一項商務分析服務,可提供跨各種資料來源的互動式視覺效果。 你可以將 Power BI 設定為自動從 Azure 監視器匯入記錄資料,以利用這些視覺效果。

如需常見 Service Fabric 監視分析案例的概觀,請參閱使用 Service Fabric 診斷常見案例

Azure 監視器匯出工具

您可以使用下列方法將資料從 Azure 監視器中提取至其他工具:

若要開始使用適用於 Azure 監視器的 REST API,請參閱 Azure 監視 REST API 逐步解說 (機器翻譯)。

Kusto 查詢

您可以使用 Kusto 查詢語言 (KQL) 分析 Azure 監視器記錄/Log Analytics 存放區中的監視資料。

重要

當您從入口網站的服務功能表中選取 [記錄] 時,Log Analytics 會隨即開啟,並將查詢範圍設定為目前的服務。 此範圍表示記錄查詢只會包含該資源類型的資料。 如果您想要執行包含其他 Azure 服務資料的查詢,請從 [Azure 監視器] 功能表中選取 [記錄]。 如需詳細資訊,請參閱 Azure 監視器 Log Analytics 中的記錄查詢範圍和時間範圍

如需各項服務的常見查詢清單,請參閱 Log Analytics 查詢介面 (機器翻譯)。

範例查詢

下列查詢將傳回 Service Fabric 事件,包括節點上的動作。 如需其他有用的查詢,請參閱 Service Fabric 事件

傳回過去一小時所記錄的操作事件:

ServiceFabricOperationalEvent
| where TimeGenerated > ago(1h)
| join kind=leftouter ServiceFabricEvent on EventId
| project EventId, EventName, TaskName, Computer, ApplicationName, EventMessage, TimeGenerated
| sort by TimeGenerated

傳回 HealthState == 3 (錯誤) 的健康情況報告,並從 EventMessage 欄位擷取更多屬性:

ServiceFabricOperationalEvent
| join kind=leftouter ServiceFabricEvent on EventId
| extend HealthStateId = extract(@"HealthState=(\S+) ", 1, EventMessage, typeof(int))
| where TaskName == 'HM' and HealthStateId == 3
| extend SourceId = extract(@"SourceId=(\S+) ", 1, EventMessage, typeof(string)),
         Property = extract(@"Property=(\S+) ", 1, EventMessage, typeof(string)),
         HealthState = case(HealthStateId == 0, 'Invalid', HealthStateId == 1, 'Ok', HealthStateId == 2, 'Warning', HealthStateId == 3, 'Error', 'Unknown'),
         TTL = extract(@"TTL=(\S+) ", 1, EventMessage, typeof(string)),
         SequenceNumber = extract(@"SequenceNumber=(\S+) ", 1, EventMessage, typeof(string)),
         Description = extract(@"Description='([\S\s, ^']+)' ", 1, EventMessage, typeof(string)),
         RemoveWhenExpired = extract(@"RemoveWhenExpired=(\S+) ", 1, EventMessage, typeof(bool)),
         SourceUTCTimestamp = extract(@"SourceUTCTimestamp=(\S+)", 1, EventMessage, typeof(datetime)),
         ApplicationName = extract(@"ApplicationName=(\S+) ", 1, EventMessage, typeof(string)),
         ServiceManifest = extract(@"ServiceManifest=(\S+) ", 1, EventMessage, typeof(string)),
         InstanceId = extract(@"InstanceId=(\S+) ", 1, EventMessage, typeof(string)),
         ServicePackageActivationId = extract(@"ServicePackageActivationId=(\S+) ", 1, EventMessage, typeof(string)),
         NodeName = extract(@"NodeName=(\S+) ", 1, EventMessage, typeof(string)),
         Partition = extract(@"Partition=(\S+) ", 1, EventMessage, typeof(string)),
         StatelessInstance = extract(@"StatelessInstance=(\S+) ", 1, EventMessage, typeof(string)),
         StatefulReplica = extract(@"StatefulReplica=(\S+) ", 1, EventMessage, typeof(string))

使用取得特定服務和節點來彙總的 Service Fabric 操作事件:

ServiceFabricOperationalEvent
| where ApplicationName  != "" and ServiceName != ""
| summarize AggregatedValue = count() by ApplicationName, ServiceName, Computer 

警示

在監視資料中發現特定狀況時,Azure 監視器警示會主動通知您。 警示可讓您在客戶發現系統發生問題前,就先及早識別和解決問題。 如需詳細資訊,請參閱 Azure 監視器警示

Azure 資源的常見警示有許多來源。 如需 Azure 資源的常見警示範例,請參閱記錄警示查詢範例 (機器翻譯)。 Azure 監視器基準警示 (AMBA) 網站提供半自動化方法來實作重要的平台計量警示、儀表板和指導方針。 此網站適用於持續擴充的 Azure 服務子集,包括屬於 Azure 登陸區域 (ALZ) 的所有服務。

常見的警示結構描述會將 Azure 監視器警示通知的使用量標準化。 如需詳細資訊,請參閱一般警示結構描述 (機器翻譯)。

警示類型

您可以針對在 Azure 監視器資料平台中的任何計量或記錄資料來源發出警示。 警示有許多不同的類型,具體取決於您監視的服務以及所收集的監視資料。 不同類型的警示各有優缺點。 如需詳細資訊,請參閱選擇正確的監視警示類型 (機器翻譯)。

下列清單介紹可建立的 Azure 監視器警示類型:

  • 計量警示 (機器翻譯) 會定期評估資源計量。 這些計量可以是平台計量、自訂計量、Azure 監視器轉換成計量的記錄,或 Application Insights 計量。 計量警示還可以套用多個條件和動態閾值。
  • 記錄警示 (機器翻譯) 可讓使用者使用 Log Analytics 查詢,以預先定義的頻率評估資源記錄。
  • 活動記錄警示 (機器翻譯) 會在發生符合定義條件的新活動記錄事件時觸發。 資源健康狀態警示和服務健康情況警示是報告服務和資源健康狀態的活動記錄警示。

某些 Azure 服務也支援智慧偵測警示Prometheus 警示建議的警示規則

對於某些服務,若要進行大規模監控,您可以將同一計量警示規則套用至相同 Azure 區域中存在的多個同類型資源。 系統會針對每個受監視的資源傳送個別通知。 如需支援的 Azure 服務和雲端,請參閱使用一個警示規則監視多個資源 (機器翻譯)。

Service Fabric 警示規則

下表列出 Service Fabric 的一些警示規則。 這些警示只是其中一些範例。 您可以為 Service Fabric 監視資料參考Service Fabric 事件清單中列出的任何計量、記錄項目或活動記錄項目設定警示。

警示類型 Condition 描述
節點事件 節點關閉 ServiceFabricOperationalEvent,其中 EventID >= 25622 和 EventID <= 25626。 您可在節點事件參考中找到這些事件識別碼。
應用程式事件 復原應用程式升級 ServiceFabricOperationalEvent,其中 EventID == 29623 或 EventID == 29624。 您可在應用程式事件參考中找到這些事件識別碼。
資源健康情況 升級服務無法連線/無法使用 叢集會進入 UpgradeServiceUnreachable 狀態。

Advisor 建議

對於一些服務,如果在資源作業期間發生重大狀況或有即將到來的變更,入口網站的服務 [概觀] 頁面上會顯示警示。 您可以在左側功能表中 [監視] 底下的 [Advisor 建議] 中找到警示的詳細資訊和建議的修正。 在正常作業期間,不會顯示 Advisor 建議。

如需 Azure Advisor 的詳細資訊,請參閱 Azure Advisor 概觀 (機器翻譯)。

我們已說明監視的每個區域及範例案例,以下是監視上述所有區域所需之 Azure 監視工具及設定的摘要。

您也可以使用及修改的範例 ARM 範本,來將所有必要資源和代理程式的部署自動化。