共用方式為


機器學習實驗和模型Git 整合和部署管線 (預覽版)

機器學習實驗模型會與 Microsoft Fabric 中的生命週期管理功能整合,在整個產品生命週期內提供所有開發小組成員之間的標準化共同作業。 生命週期管理透過持續將功能和錯誤修正傳遞至多個環境,促進有效的產品版本控制和發行程序。 若要深入瞭解,請參閱 什麼是 Microsoft Fabric 中的生命週期管理?

這很重要

這項功能目前處於預覽階段。

機器學習實驗和模型 Git 整合

機器學習 (ML) 實驗和模型包含中繼資料和資料。 ML 實驗包含 runs ,而 ML 模型包含 model versions. 從開發工作流程的角度來看, Notebooks 可能會參考 ML 實驗或 ML 模型。

原則上, 資料不會儲存在 Git 中,只會追蹤成品中繼資料。 根據預設,ML 實驗和模型是透過 Git 同步處理/更新程式來管理,但experiment runsmodel versions不會在 Git 中追蹤或版本設定版本,而且其資料會保留在工作區儲存體中。 筆記本、實驗和模型之間的譜系繼承自 Git 連線的工作區。

Git 表示法

下列資訊會在機器學習實驗和模型的 Git 連線工作區中序列化和追蹤:

  • 顯示名稱
  • 版本
  • 邏輯指導。 追蹤的邏輯 GUID 是自動產生的跨工作區識別碼,代表專案及其原始檔控制表示法。
  • 相依性。 筆記本、實驗和模型之間的譜系會保留在 Git 連線的工作區中,以維持相關成品之間的清晰可追溯性。

這很重要

在目前的體驗中,只有機器學習實驗和模型成品中繼資料會在 Git 中追蹤。 實驗執行模型版本 (執行輸出和模型資料) 不會儲存在 Git 中或版本設定版本;他們的資料保留在工作區儲存空間中。

Git 整合功能

下列功能可供使用:

  • 將 ML 實驗和模型成品中繼資料序列化為 Git 追蹤的 JSON 表示法。
  • 支援連結到同一個 Git 分支的多個工作區,使追蹤的元資料能夠跨工作區同步。
  • 允許直接套用更新或透過提取要求控制更新,以管理上游和下游工作區/分支之間的變更。
  • 在 Git 中追蹤實驗和模型的重新命名,以保留跨工作區的身分識別。
  • 不會對 experiment runs 或 採取 model versions任何動作;其資料會保留在工作區儲存體中,且不會被 Git 儲存或覆寫。

部署管線中的機器學習實驗和模型

Microsoft Fabric 生命週期管理部署管線支援機器學習 (ML) 實驗和模型。 它支援環境分割 最佳實務

這很重要

在目前體驗的部署管線中,只會追蹤機器學習實驗和模型成品。 實驗執行模型版本 不會由管線追蹤或版本化;他們的資料保留在工作區儲存空間中。

ML 實驗和模型部署管線整合功能:

  • 支援跨開發、測試和生產工作區部署 ML 實驗和模型。
  • 部署只會同步成品中繼資料; experiment runs 並且 model versions (他們的數據)被保留並且不會被覆蓋。
  • 實驗和模型的重新命名會在部署管線中時跨工作區傳播。
  • 筆記本、實驗和模型之間的譜系會在管線部署期間跨工作區維護,以保留相關成品之間的可追蹤性。