範例筆記本
此範例筆記本會使用 PyTorch 執行單一深度學習模型定型作業,其會追蹤為 MLflow 執行。 它會在每個 10 個 epoch 之後記錄檢查點模型。 每個檢查點都會追蹤為 MLflow LoggedModel。 使用 MLflow 的 UI 或搜尋 API,您可以檢查檢查點模型,並依正確性加以排名。
筆記本會 scikit-learn 安裝和 torch 連結庫。
MLflow 3 深度學習模型與檢查點筆記本
使用UI來探索模型效能並註冊模型
執行筆記本之後,您可以在 MLflow 實驗 UI 中檢視儲存的檢查點模型。 實驗的連結會出現在筆記本數據格輸出中,或遵循下列步驟:
按兩下工作區提要欄位中的 [ 實驗 ]。
在實驗清單中尋找您的實驗。 您可以選取 [ 僅我的實驗 ] 複選框,或使用 [ 篩選實驗 ] 搜尋方塊來篩選實驗清單。
按兩下實驗的名稱。 [ 執行] 頁面隨即開啟。 實驗包含一個 MLflow 執行。
按兩下 [ 模型] 索引標籤 。此畫面會追蹤個別檢查點模型。 針對每個檢查點,您可以看到模型的正確性,以及其所有參數和元數據。
在範例筆記本中,您已將效能最佳的模型註冊到 Unity 目錄。 您也可以從 UI 註冊模型。 若要這樣做,請遵循下列步驟:
從 [ 模型] 索引標籤中,按兩下要註冊的模型名稱。
從模型詳細數據頁面的右上角,按兩下 [註冊模型]。
小提示
在註冊模型之後,模型可能需要幾分鐘的時間才會出現在UI中。 請勿多次按下 Register 模型 ,否則您將註冊重複的模型。
選取 [Unity 目錄 ],然後從下拉功能表中選取現有的模型名稱,或輸入新名稱。
按一下 [註冊]。
使用 API 來排名檢查點模型
下列程式代碼示範如何依精確度來排名檢查點模型。 如需使用 API 搜尋記錄模型的詳細資訊,請參閱 搜尋和篩選記錄的模型。
ranked_checkpoints = mlflow.search_logged_models(
output_format="list",
order_by=[{"field_name": "metrics.accuracy", "ascending": False}]
)
best_checkpoint: mlflow.entities.LoggedModel = ranked_checkpoints[0]
print(best_checkpoint.metrics[0])
<Metric:
dataset_digest='9951783d',
dataset_name='train',
key='accuracy',
model_id='m-bba8fa52b6a6499281c43ef17fcdac84',
run_id='394928abe6fc4787aaf4e666ac89dc8a',
step=90,
timestamp=1730828771880,
value=0.9553571428571429
>
worst_checkpoint: mlflow.entities.LoggedModel = ranked_checkpoints[-1]
print(worst_checkpoint.metrics[0])
<Metric:
dataset_digest='9951783d',
dataset_name='train',
key='accuracy',
model_id='m-88885bc26de7492f908069cfe15a1499',
run_id='394928abe6fc4787aaf4e666ac89dc8a',
step=0,
timestamp=1730828730040,
value=0.35714285714285715
MLflow 實驗頁面上的 [ 模型 ] 索引標籤與目錄總管中的模型版本頁面有何差異?
實驗頁面的 [模型] 索引標籤和目錄總管中的模型版本頁面會顯示模型的相關類似資訊。 這兩個檢視在模型開發和部署生命週期中有不同的角色。
- 實驗頁面的 [ 模型 ] 索引標籤會顯示單一頁面上實驗中記錄模型的結果。 此頁面上的 [ 圖表 ] 索引標籤提供視覺效果,可協助您比較模型,並選取要註冊至 Unity 目錄的模型版本以進行可能的部署。
- 在目錄總管中,模型版本頁面提供所有模型效能和評估結果的概觀。 此頁面會顯示所有鏈接環境的模型參數、計量和追蹤,包括不同的工作區、端點和實驗。 這很適合用於監視和部署,而且特別適用於 部署作業。 部署作業中的評估工作會建立出現在此頁面的其他計量。 作業的核准者接著可以檢閱此頁面,以評估是否要核准部署的模型版本。
後續步驟
若要深入瞭解 LoggedModel MLflow 3 中引進的追蹤,請參閱下列文章:
若要深入瞭解如何搭配傳統 ML 工作流程使用 MLflow 3,請參閱下列文章: