次の方法で共有


機械学習の実験とモデルの Git 統合とデプロイ パイプライン (プレビュー)

機械学習の実験モデルは、Microsoft Fabric のライフサイクル管理機能と統合され、製品の寿命を通じてすべての開発チーム メンバー間の標準化されたコラボレーションが提供されます。 ライフサイクル管理は、機能とバグ修正を複数の環境に継続的に提供することで、効果的な製品バージョン管理とリリース プロセスを容易にします。 詳細については、「 Microsoft Fabric のライフサイクル管理とは」を参照してください。

Important

この機能は プレビュー段階です

機械学習の実験とモデルの Git 統合

機械学習 (ML) の実験とモデルには、メタデータとデータの両方が含まれています。 ML の実験には runs が含まれますが、ML モデルには model versionsが含まれています。 開発ワークフローの観点から見ると、 ノートブックは ML 実験または ML モデルを参照する場合があります。

原則として、 データは Git に格納されず、アーティファクト メタデータのみが追跡されます。 既定では、ML の実験とモデルは Git 同期/更新プロセスを通じて管理されますが、 experiment runsmodel versions は Git で追跡またはバージョン管理されず、そのデータはワークスペース ストレージに保持されます。 ノートブック、実験、モデル間の系列は、Git に接続されたワークスペースから継承されます。

Git 表現

次の情報は、機械学習の実験とモデルのために Git に接続されたワークスペースでシリアル化および追跡されます。

  • 表示名
  • バージョン
  • 論理 guid。 追跡される論理 guid は、項目とそのソース管理表現を表す、自動的に生成されたクロスワークスペース識別子です。
  • 依存関係。 ノートブック、実験、モデル間の系列は、Git に接続されたワークスペース間で保持され、関連する成果物間で明確な追跡可能性が維持されます。

Important

現在のエクスペリエンスでは、機械学習の実験とモデル成果物のメタデータのみが Git で追跡されます。 実験の実行モデルのバージョン (実行出力とモデル データ) は Git に格納またはバージョン管理されません。データはワークスペース ストレージに残ります。

Git 統合機能

次の機能を利用できます。

  • ML 実験とモデル成果物メタデータを Git 追跡 JSON 表現にシリアル化します。
  • 同じ Git ブランチにリンクされている複数のワークスペースをサポートし、追跡されたメタデータをワークスペース間で同期できるようにします。
  • アップストリームとダウンストリームのワークスペース/ブランチ間の変更を管理するために、更新プログラムを直接適用するか、プル要求を使用して制御できるようにします。
  • Git で実験とモデルの名前を追跡し、ワークスペース間で ID を保持します。
  • experiment runsまたはmodel versionsに対してアクションは実行されません。データはワークスペース ストレージに保持され、Git によって保存または上書きされることはありません。

デプロイ パイプラインでの機械学習の実験とモデル

機械学習 (ML) の実験とモデルは、Microsoft Fabric ライフサイクル管理デプロイ パイプラインでサポートされています。 これにより、環境のセグメント化 のベスト プラクティスが可能になります

Important

現在のエクスペリエンスのデプロイ パイプラインでは、機械学習の実験とモデルの成果物のみが追跡されます。 実験の実行モデルのバージョン は、パイプラインによって追跡またはバージョン管理されません。データはワークスペース ストレージに残ります。

ML の実験とモデルのデプロイ パイプライン統合機能:

  • 開発、テスト、運用の各ワークスペースに ML の実験とモデルをデプロイするためのサポート。
  • デプロイでは、成果物のメタデータのみが同期されます。 experiment runsmodel versions (データ) は保持され、上書きされません。
  • デプロイ パイプラインに含めると、実験とモデルの名前がワークスペース間で伝達されます。
  • ノートブック、実験、モデル間の系列は、パイプラインのデプロイ中にワークスペース間で維持され、関連する成果物間の追跡可能性が維持されます。