Microsoft Fabric 提供內建的機器學習實驗與模型監控功能。 你可以直接從 Fabric Monitoring 中心追蹤實驗執行,並監控活躍機器學習模型端點的即時流量。 這些監控功能讓您能看到機器學習工作流程,並幫助您了解已部署模型的使用情況。
這很重要
這項功能目前處於預覽階段。
先決條件
從監測中心監控機器學習實驗
機器學習實驗直接整合進 Fabric Monitoring 中心。 此整合提供集中檢視所有實驗活動、相關筆記本、Spark 應用程式,以及這些應用程式所產生的機器學習實驗運行。 透過使用監控中心,你可以追蹤、篩選並排除實驗運行問題,而不必偏離單一統一體驗。
檢視實驗運行在監控中心集線器
要查看從監測中心進行的機器學習實驗:
- 從 Microsoft Fabric 左側導覽窗格開啟 Monitor hub。
- 選擇 實驗 篩選器,可將視圖縮小至與實驗相關的活動。
- 瀏覽實驗活動清單,顯示狀態、開始時間、地點及持續時間等細節。
篩選與搜尋實驗執行
監測中心提供篩選選項,幫助您找到特定的實驗運行:
- 狀態:依運行狀態篩選,如成功、失敗或進行中。
- 時間範圍:將結果縮小到特定時間窗內創建的執行。
- 提交者:由提交者執行篩選。
- 地點:如果你能使用多個工作區,請依工作區篩選,聚焦於相關實驗。
這些篩選器讓管理與分析實驗變得更容易,尤其是在機器學習活動量大的工作區中。
從筆記本活動中追蹤與機器學習相關的實驗運行
監控中心將機器學習實驗整合進筆記本活動檢視中。 當你選擇觸發機器學習實驗執行的筆記本活動時,可以進入 項目快照 頁面,查看執行時捕捉的實驗與執行快照。 此頁面同時顯示筆記本執行時所有設定與參數的快照。
要查看相關實驗,則是從筆記本活動執行:
- 打開 Monitor 中心,找到你感興趣的筆記本活動。
- 選擇筆記本活動以開啟其詳細檢視。
- 請前往 項目快照 頁面,查看相關的實驗與執行。
項目快照頁面包含筆記本執行時所產生的所有實驗與執行清單,這些記錄是在筆記本執行時擷取的。
當你需要除錯、重現或審核特定筆記本執行所產生的機器學習實驗時,這種方法非常有用。
監控機器學習模型端點的流量
當你為特定模型版本啟用 機器學習模型端點 時,Microsoft Fabric 會開始追蹤該端點的流量。 流量監控讓您了解模型被呼叫的頻率,幫助您了解採用情況並規劃容量。
查看端點流量
要查看活躍模型端點的流量:
- 進入你工作空間中的機器學習模型。
- 選擇具有主動端點的模型版本。
- 在模型詳細檢視中,向下捲動至 端點指標 區塊,即可查看該版本的流量資訊。
機器學習模型端點指標檢視提供端點使用的關鍵指標,包括:
| Metric | 說明 |
|---|---|
| 請求次數 | 端點收到的總預測請求數。 |
| 錯誤計數 | 端點收到的失敗請求總數。 |
| 請求延遲 | 處理並回應預測請求所花費的時間。 |
備註
指標通常會在終端接收流量後 15 分鐘內出現。 若無資料或線路,該端點可能在選定時間範圍內處於非活躍狀態,或其遙測資料可能在 90 天後失效。 試著調整時間範圍,或是在終端點使用後再回來查看。
監控各型號的流量
如果你的模型有多個活躍版本端點,你可以比較不同版本的流量模式。 此比較有助於你辨識哪個模型版本收到最多請求,以及是否採用了較新的版本。
備註
機器學習模型可同時擁有最多五個版本的主動端點。 每個活躍版本端點可獨立提供流量監控。
利用交通數據管理容量
主動模型端點會根據進出流量消耗 Fabric 容量單元(CU)。 當流量增加時,端點可自動擴展至最多三個運算節點。 監控流量模式有助於:
- 找出可能受益於 自動睡眠 功能的低流量端點,以降低容量消耗。
- 監測可能影響終端延遲或容量壓力的流量突發。
- 確定停用不再使用的模型版本端點的正確時機。
有關端點容量消耗與計費的詳細資訊,請參閱 機器學習模型端點消耗率。
小提示
使用 Fabric 容量指標應用程式 查看模型端點操作的總容量使用率。 模型端點操作會顯示在指標應用程式中項目名稱「Model Endpoint」下。