Vowpal Wabbit モデルのスコアリング

[アーティクル]
06/01/2023

この記事では、Azure Machine Learning デザイナーで Vowpal Wabbit モデルのスコアリング コンポーネントを使用して、既存のトレーニングされた Vowpal Wabbit モデルを使用して入力データセットのスコアを生成する方法について説明します。

このコンポーネントは、Vowpal Wabbit フレームワークの最新バージョンであるバージョン 8.8.1 を提供します。このコンポーネントを使用して、VW バージョン 8 形式で保存されたトレーニング済みのモデルを使用してデータをスコア付けします。

Vowpal Wabbit モデルのスコアリングを構成する方法

Score Vowpal Wabbit Model コンポーネントを実験に追加します。
トレーニング済みの Vowpal Wabbit モデルを追加し、左側の入力ポートに接続します。同じ実験で作成されたトレーニング済みのモデルを使用することも、デザイナーの左側のナビゲーションウィンドウにある [データセット] カテゴリで、保存済みのモデルを見つけることもできます。ただし、このモデルは Azure Machine Learning デザイナーで使用できる必要があります。

注意

Vowpal Wabbit 8.8.1 モデルのみがサポートされています。他のアルゴリズムを使用してトレーニングされた保存済みのモデルを接続することはできません。
テストデータセットを追加し、右側の入力ポートに接続します。テストデータセットが、テストデータファイルが含まれているディレクトリの場合は、 [テストデータファイルの名前] を使用してテストデータファイル名を指定します。テストデータセットが 1 つのファイルの場合は、 [テストデータファイルの名前] を空のままにします。
[VW 引数] テキストボックスに、Vowpal Wabbit 実行可能ファイルに有効なコマンドライン引数のセットを入力します。

Azure Machine Learning でサポートされている Vowpal Wabbit 引数とサポートされていない引数の詳細については、「テクニカルノート」セクションを参照してください。
テストデータファイルの名前: 入力データを含むファイルの名前を入力します。この引数は、テストデータセットがディレクトリである場合にのみ使用されます。
Specify file type (ファイルの種類を指定) : トレーニングデータで使用する形式を指定します。 Vowpal Wabbit では、次の 2 つの入力ファイル形式がサポートされています。
- [VW] は、Vowpal Wabbit によって使用される内部形式を表します。詳細については、Vowpal Wabbit wiki ページを参照してください。
- SVMLight は、他のいくつかの機械学習ツールで使用される形式です。
スコアと一緒にラベルを出力する場合は、 [ラベルを含む余分な列を含める] オプションを選択します。

通常、テキストデータを処理する場合は、Vowpal Wabbit はラベルを必要とせず、データの各行のスコアのみを返します。
結果と一緒に生のスコアを出力する場合は、[Include an extra column containing raw scores] (生のスコアを含む余分な列を含める) オプションを選択します。
パイプラインを送信します。

結果

トレーニングの完了後:

結果を視覚化するには、[Vowpal Wabbit モデルのスコアリング] コンポーネントの出力を右クリックします。出力には、0 ～ 1 の正規化された予測スコアが示されます。
結果を評価するには、出力データセットに、モデルの評価コンポーネントの要件を満たす特定のスコア列の名前が含まれている必要があります。
- 回帰タスクの場合は、評価するデータセットに、スコア付けされたラベルを表す Regression Scored Labels という名前の 1 つの列が含まれている必要があります。
- 二項分類タスクの場合は、評価するデータセットに Binary Class Scored Labels、Binary Class Scored Probabilities という名前の 2 つの列があります。これらはそれぞれ、スコア付けラベルと確率を表します。
- マルチ分類タスクの場合は、評価するデータセットに、スコア付けされたラベルを表す Multi Class Scored Labels という名前の 1 つの列が含まれている必要があります。
Vowpal Wabbit モデルのスコアリングコンポーネントの結果を直接評価することはできないことに注意してください。評価する前に、上記の要件に従ってデータセットを変更する必要があります。

テクニカルノート

このセクションには、実装の詳細、ヒント、よく寄せられる質問への回答が含まれています。

パラメーター

Vowpal Wabbit には、アルゴリズムを選択およびチューニングするためのコマンドラインオプションが多数あります。これらのオプションについて、ここで詳細に説明することはできません。Vowpal Wabbit wiki ページを参照することをお勧めします。

次のパラメーターは Azure Machine Learning Studio (classic) ではサポートされていません。

https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments で指定された入力/出力オプション

これらのプロパティは、コンポーネントによってあらかじめ自動的に構成されています。
また、複数の出力を生成したり、複数の入力を受け取ったりするオプションは許可されていません。これらには、 --cbt 、 --lda 、および --wap が含まれます。
教師あり学習アルゴリズムのみがサポートされています。これにより、–active、--rank、--search などのオプションが禁止されます。

上記以外のすべての引数は許可されます。

次のステップ

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。

Vowpal Wabbit モデルのスコアリング

Vowpal Wabbit モデルのスコアリングを構成する方法

結果

テクニカル ノート

パラメーター

次のステップ

その他のリソース

テクニカルノート