監控 Microsoft Fabric 中的機器學習實驗與模型(預覽版)

Microsoft Fabric 提供內建的機器學習實驗與模型監控功能。 你可以直接從 Fabric Monitoring 中心追蹤實驗執行,並監控活躍機器學習模型端點的即時流量。 這些監控功能讓您能看到機器學習工作流程,並幫助您了解已部署模型的使用情況。

這很重要

這項功能目前處於預覽階段。

先決條件

從監測中心監控機器學習實驗

機器學習實驗直接整合進 Fabric Monitoring 中心。 此整合提供集中檢視所有實驗活動、相關筆記本、Spark 應用程式,以及這些應用程式所產生的機器學習實驗運行。 透過使用監控中心,你可以追蹤、篩選並排除實驗運行問題,而不必偏離單一統一體驗。

檢視實驗運行在監控中心集線器

要查看從監測中心進行的機器學習實驗:

  1. 從 Microsoft Fabric 左側導覽窗格開啟 Monitor hub。
  2. 選擇 實驗 篩選器,可將視圖縮小至與實驗相關的活動。
  3. 瀏覽實驗活動清單,顯示狀態、開始時間、地點及持續時間等細節。

從監控中心展示如何監控機器學習實驗的截圖。

篩選與搜尋實驗執行

監測中心提供篩選選項,幫助您找到特定的實驗運行:

  • 狀態:依運行狀態篩選,如成功、失敗或進行中。
  • 時間範圍:將結果縮小到特定時間窗內創建的執行。
  • 提交者:由提交者執行篩選。
  • 地點:如果你能使用多個工作區,請依工作區篩選,聚焦於相關實驗。

這些篩選器讓管理與分析實驗變得更容易,尤其是在機器學習活動量大的工作區中。

監控中心將機器學習實驗整合進筆記本活動檢視中。 當你選擇觸發機器學習實驗執行的筆記本活動時,可以進入 項目快照 頁面,查看執行時捕捉的實驗與執行快照。 此頁面同時顯示筆記本執行時所有設定與參數的快照。

要查看相關實驗,則是從筆記本活動執行:

  1. 打開 Monitor 中心,找到你感興趣的筆記本活動。
  2. 選擇筆記本活動以開啟其詳細檢視。
  3. 請前往 項目快照 頁面,查看相關的實驗與執行。

截圖展示了如何從筆記本操作中監控機器學習實驗。

項目快照頁面包含筆記本執行時所產生的所有實驗與執行清單,這些記錄是在筆記本執行時擷取的。

當你需要除錯、重現或審核特定筆記本執行所產生的機器學習實驗時,這種方法非常有用。

監控機器學習模型端點的流量

當你為特定模型版本啟用 機器學習模型端點 時,Microsoft Fabric 會開始追蹤該端點的流量。 流量監控讓您了解模型被呼叫的頻率,幫助您了解採用情況並規劃容量。

查看端點流量

要查看活躍模型端點的流量:

  1. 進入你工作空間中的機器學習模型。
  2. 選擇具有主動端點的模型版本。
  3. 在模型詳細檢視中,向下捲動至 端點指標 區塊,即可查看該版本的流量資訊。

機器學習模型端點指標檢視提供端點使用的關鍵指標,包括:

Metric 說明
請求次數 端點收到的總預測請求數。
錯誤計數 端點收到的失敗請求總數。
請求延遲 處理並回應預測請求所花費的時間。

顯示機器學習模型端點指標的截圖。

備註

指標通常會在終端接收流量後 15 分鐘內出現。 若無資料或線路,該端點可能在選定時間範圍內處於非活躍狀態,或其遙測資料可能在 90 天後失效。 試著調整時間範圍,或是在終端點使用後再回來查看。

監控各型號的流量

如果你的模型有多個活躍版本端點,你可以比較不同版本的流量模式。 此比較有助於你辨識哪個模型版本收到最多請求,以及是否採用了較新的版本。

備註

機器學習模型可同時擁有最多五個版本的主動端點。 每個活躍版本端點可獨立提供流量監控。

利用交通數據管理容量

主動模型端點會根據進出流量消耗 Fabric 容量單元(CU)。 當流量增加時,端點可自動擴展至最多三個運算節點。 監控流量模式有助於:

  • 找出可能受益於 自動睡眠 功能的低流量端點,以降低容量消耗。
  • 監測可能影響終端延遲或容量壓力的流量突發。
  • 確定停用不再使用的模型版本端點的正確時機。

有關端點容量消耗與計費的詳細資訊,請參閱 機器學習模型端點消耗率

小提示

使用 Fabric 容量指標應用程式 查看模型端點操作的總容量使用率。 模型端點操作會顯示在指標應用程式中項目名稱「Model Endpoint」下。