MLflow 実験の概要
このノートブックのコレクションでは、MLflow 実験の実行を開始して実行する方法を示します。
MLflow コンポーネント
MLflow は、エンド ツー エンドの機械学習ライフサイクルを管理するためのオープンソース プラットフォームです。 MLflow には 3 つの主要なコンポーネントがあります。
- 追跡
- モデル
- プロジェクト
MLflow の追跡コンポーネントを使用すると、次の API を使用して、マシン モデルのトレーニング セッション ("実行") をログに記録し、クエリを実行できます。
MLflow "実行" は、機械学習モデルのトレーニング プロセスに関連するパラメーター、メトリック、タグ、アーティファクトのコレクションです。
MLflow の実験とは
"実験" は、MLflow の組織の主要単位です。すべての MLflow 実行は、実験に属します。 各実験により、実行を視覚化、検索、比較できるだけでなく、他のツールで分析するために実行成果物またはメタデータをダウンロードできます。 実験は、Azure Databricks でホストされている MLflow 追跡サーバーで保持されます。
実験は、ワークスペース ファイル ツリーにあります。 実験の管理は、フォルダー、ノートブック、ライブラリなど、他のワークスペース オブジェクトの管理と同じツールを使用して行います。
MLflow ノートブックの例
次のノートブックでは、MLflow 追跡 API を使用して MLflow 実行を作成してログに記録する方法と、実験 UI を使用して実行を表示する方法について説明します。 これらのノートブックは、Python、Scala、R で利用できます。
Python および R のノートブックでは、ノートブックの実験を使用します。 Scala ノートブックでは、Shared
フォルダーに実験が作成されます。
Note
Databricks Runtime 10.4 LTS ML 以降では、Python ノートブックで Databricks Autologging が既定で有効になっています。