基本概念
何時會淘汰 Metrics Advisor?
從 2023 年 9 月 20 日起,您將無法建立新的 Metrics Advisor 資源。 Metrics Advisor 服務將于 2026 年 10 月 1 日淘汰。
什麼是多維度時間序列資料?
請參閱詞彙中的多維度計量 定義。
Metrics Advisor 需要多少資料才能啟動異常偵測?
至少一個資料點可以觸發異常偵測。 不過,這不會帶來最佳精確度。 服務會使用您在資料摘要建立期間指定為「填滿差距」規則的值,假設先前資料點的視窗。
建議您在您想要偵測的時間戳記之前先有一些資料。 根據資料細微性,建議的資料量會如下所示。
資料粒度 | 偵測的建議資料量 |
---|---|
少於 5 分鐘 | 4 天的資料 |
5 分鐘到 1 天 | 28 天的資料 |
超過 1 天,到 31 天 | 4 年的資料 |
大於 31 天 | 48 年的資料 |
Metrics Advisor 會處理哪些資料,以及如何保留資料?
- Metrics Advisor 會處理從客戶資料來源收集的時間序列資料、記錄資料用於模型選取,並判斷預期的資料界限。
- 客戶的時間序列資料和推斷結果將會儲存在服務內。 Metrics Advisor 不會在客戶部署服務實例的區域之外儲存或處理客戶資料。
為什麼 Metrics Advisor 不會偵測歷程記錄資料的異常狀況?
Metrics Advisor 是專為偵測即時串流資料而設計。 服務會回顧並執行異常偵測的最大歷程記錄資料長度有限制。 這表示只有特定最早時間戳記之後的資料點會有異常偵測結果。 最早的時間戳記取決於您的資料細微性。
根據資料細微性,將有異常偵測結果的歷史資料長度如下所示。
資料粒度 | 異常偵測的歷史資料長度上限 |
---|---|
少於 5 分鐘 | 上線時間 - 13 小時 |
5 分鐘到不到 1 小時 | 上線時間 - 4 天 |
1 小時到不到 1 天 | 上線時間 - 14 天 |
1 天 | 上線時間 - 28 天 |
大於 1 天,少於 31 天 | 上線時間 - 2 年 |
大於 31 天 | 上線時間 - 24 年 |
Metrics Advisor 的資料保留和限制為何?
- 資料保留。 Metrics Advisor 最多會保留 10,000 個時間間隔是什麼間隔 ? 從目前時間戳記向前計算,無論是否有可用的資料。 資料會從視窗中刪除。 資料保留對應到不同計量細微性的天數計數。
細微性(分鐘) | 保留期(日) |
---|---|
1 | 6.94 |
5 | 34.72 |
15 | 104.1 |
60(=每小時) | 416.67 |
1440(=每日) | 10000.00 |
- 限制一個計量內的時間序列計數上限。
它們可能會在一個計量內有多個維度,而且每個維度可能有多個值。 一個計量的最大維度組合不應超過 100k 。
- 當資料摘要詳細資料頁面上達到 80% 的限制時 ,Metrics Advisor 資源管理員和資料摘要擁有者會收到通知。
- 如果計量已超過限制,資料摘要 將會暫停 ,並等候客戶採取後續動作。 建議使用篩選,將資料摘要分割成多個資料摘要。
- 儲存在一個 Metrics Advisor 實例中的資料點上限限制
Metrics Advisor 會計算從第一個擷取時間戳記開始上線至實例的所有資料摘要的總資料點。 要儲存在一個 Metrics Advisor 實例中的資料點數目上限為 20 億 。
- 當資料摘要清單頁面和新增資料摘要頁面達到 80% 的限制時 ,計量建議程式資源管理員和所有使用者都會收到通知。
- 如果總資料點已超過限制,所有資料摘要 都會暫停 ,而且也會封鎖 新的摘要上線 。 建議您刪除未使用的資料摘要,或在訂用帳戶內建立新的 Metrics Advisor 資源。
為什麼我無法登入 Metrics Advisor? 錯誤訊息指出「資源因 90 天內非使用中而解除委任」
有兩種情況會解除委任資源:
- 已建立 Metrics Advisor 資源,但在 90 天內未上線任何資料摘要。 資源將在 90 天后因閒置而解除委任。
- 如果已建立一或多個資料摘要,但沒有任何新資料內嵌至 Metrics Advisor,則服務會進入閒置模式,而不需要處理任何資料。 系統會根據計量細微性,嘗試定期從來源擷取資料。 不過,如果持續沒有可用的資料,或連續 90 天不會處理單一時間序列,則會解除委任資源。 當資源解除委任時,所有與資源相關聯的歷程記錄資料都會遺失 。
如果您想要重新開機使用量,建議您建立新的資源並刪除舊的資源。
如何?偵測到尖峰和下降為異常?
如何?偵測到與一般(季節性)模式不一樣的異常狀況?
「智慧型偵測」能夠瞭解資料模式,包括季節性模式。 然後,它會偵測不符合一般模式的資料點做為異常。 如需詳細資訊,請參閱 微調偵測組態 。
Metrics Advisor 是否支援 VNET 背後的資料來源?
否,Metrics Advisor 目前不支援 VNET 背後的資料來源。
如何?將平面線偵測為異常?
如果您的資料通常相當不穩定且波動很大,而且您想要在資料變得太穩定,甚至變成一條平線時收到警示,「變更閾值」能夠設定為在變更太小時偵測這類資料點。 如需詳細資訊, 請參閱異常偵測組態 。
如何設定電子郵件設定,並透過電子郵件啟用警示?
具有訂用帳戶管理員或資源群組系統管理員許可權的使用者必須流覽至在Azure 入口網站中建立的 Metrics Advisor 資源,然後選取 [存取控制(IAM)] 索引標籤。
選取 [新增角色指派]
挑選認知服務計量建議程式管理員istrator 的角色 ,選取您的帳戶,如下圖所示。
選取 [ 儲存] 按鈕,並新增為 Metrics Advisor 資源的系統管理員。 上述所有動作都必須由訂用帳戶管理員或資源群組管理員執行。
傳播許可權最多可能需要一分鐘的時間。 然後,選取您的 Metrics Advisor 工作區,然後選取左側導覽面板中的 [電子郵件] 設定 選項。 填入必要的專案,特別是 SMTP 相關資訊。
選取 [ 儲存 ],然後您全都會使用電子郵件設定進行設定。 您可以建立新的攔截,並訂閱近乎即時警示的計量異常。
進階概念
Metric Advisor 如何建置多維度計量的診斷樹狀結構?
計量可以依維度分割成多個時間序列。 例如,計量 Response latency
會針對小組所擁有的所有服務進行監視。 類別 Service
可以做為維度來擴充計量,因此我們會 Response latency
依 Service1
、 Service2
等方式分割。 每個服務都可以部署在多個資料中心的不同電腦上,因此計量可以進一步分割和 Machine
Data center
。
服務 | 資料中心 | 機器 |
---|---|---|
S1 | DC1 | M1 |
S1 | DC1 | M2 |
S1 | DC2 | M3 |
S1 | DC2 | M4 |
S2 | DC1 | M1 |
S2 | DC1 | M2 |
S2 | DC2 | M5 |
S2 | DC2 | M6 |
... |
從總計 Response latency
開始,我們可以依 Service
和 Data center
Machine
向下切入計量。 不過,對於服務擁有者來說,使用路徑 Service
可能更有意義, Data center
> > Machine
或者對基礎結構工程師使用路徑 Data Center
更有意義 - Machine
> - 。 > Service
這一切都取決於您使用者的個別商務需求。
在 Metric Advisor 中,使用者可以指定他們想要向下切入或從階層式拓撲的一個節點匯總的任何路徑。 更精確地說,階層式拓撲是導向非循環圖表,而不是樹狀結構。 包含所有潛在維度組合的完整階層式拓撲,如下所示:
理論上,如果維度 Service
具有 Ls
相異值、維度 Data center
具有 Ldc
相異值,且維度 Machine
具有 Lm
相異值,則階層式拓撲中可能會有 (Ls + 1) * (Ldc + 1) * (Lm + 1)
維度組合。
但通常並非所有維度組合都是有效的,這可以大幅降低複雜性。 目前如果使用者自行匯總計量,我們不會限制維度數目。 如果您需要使用 Metrics Advisor 所提供的匯總功能,維度數目不應超過 6。 不過,我們會將計量維度所擴充的時間序列數目限制為小於 10,000。
診斷 頁面中的 [診斷樹狀 結構] 工具只會顯示偵測到異常的節點,而不是整個拓撲。 這是為了協助您專注于目前的問題。 它可能不會在計量內顯示所有異常,而是會根據貢獻顯示最上層的異常狀況。 如此一來,我們就能快速找出異常資料的影響、範圍和散佈路徑。 這可大幅減少我們需要關注的異常數目,並協助使用者瞭解並找出其關鍵問題。
例如,當 發生 Service = S2 | Data Center = DC2 | Machine = M5
異常時,異常的偏差會影響父節點,該節點 Service= S2
也偵測到異常,但異常不會影響位於 的整個資料中心 DC2
和上的所有服務 M5
。 事件樹狀結構會如下列螢幕擷取畫面所示建置,在 上 Service = S2
擷取頂端異常,而根本原因可以在兩個路徑中進行分析,這兩個路徑都會導致 Service = S2 | Data Center = DC2 | Machine = M5
。