計分 Vowpal Wabbit 模型

發行項
06/01/2023

本文描述如何在 Azure Machine Learning 設計工具中使用為 Vowpal Wabbit 模型評分元件，利用現有的已定型 Vowpal Wabbit 模型來為一組輸入資料產生分數。

此元件會提供最新版的 Vowpal Wabbit 架構 (8.8.1 版)。您可以使用此元件，利用以 VW 第 8 版格式儲存的已定型模型來為資料評分。

如何設定「為 Vowpal Wabbit 模型評分」

將 [為 Vowpal Wabbit 模型評分] 元件新增至您的實驗。
新增已定型的 Vowpal Wabbit 模型，並將其連線到左側的輸入埠。您可以使用在相同實驗中建立的已定型模型，或在設計工具左邊瀏覽窗格的 [資料集] 類別中找出已儲存的模型。不過，該模型必須可於 Azure Machine Learning 設計工具中使用。

注意

只支援 Vowpal Wabbit 8.8.1 模型；您無法將使用其他演算法來定型的已儲存模型連線。
新增測試資料集，並將其連線到右邊的輸入埠。如果測試資料集是包含測試資料檔案的目錄，請以測試資料檔案的名稱指定測試資料檔案名稱。如果測試資料集是單一檔案，請讓 [測試資料檔案的名稱] 保持空白。
在 [VW 引數] 文字方塊中，輸入一組對 Vowpal Wabbit 可執行檔有效的命令列引數。

如需 Azure Machine Learning 中支援和不支援哪些 Vowpal Wabbit 引數的相關資訊，請參閱技術說明一節。
測試資料檔案的名稱：輸入包含輸入資料的檔案名稱。僅在測試資料集是目錄時，才會使用這個引數。
指定檔案類型：指出定型資料所使用的格式。 Vowpal Wabbit 支援這兩個輸入檔案格式：
- VW 代表 Vowpal Wabbit 所使用的內部格式。如需詳細資料，請參閱 Vowpal Wabbit Wiki 頁面。
- SVMLight 是其他一些機器學習工具所使用的格式。
如果您想要一起輸出標籤與分數，請選取 [加入包含標籤的額外資料行] 選項。

一般來說，在處理文字資料時，Vowpal Wabbit 不需要標籤，而且只會傳回每個資料列的分數。
如果您想要一起輸出原始分數與結果，請選取 [加入包含原始分數的額外資料行] 選項。
提交管線。

結果

定型完成後：

若要以視覺化方式呈現結果，請以滑鼠右鍵按一下為 Vowpal Wabbit 模型評分元件的輸出。該輸出會指出已正規化為 0 到 1 的預測分數。
若要評估結果，輸出資料集應該包含符合評估模型元件需求的特定分數資料行名稱。
- 針對迴歸工作，要評估的資料集必須有一個名為 Regression Scored Labels 的資料行，其代表評分標籤。
- 針對二元分類工作，要評估的資料集必須有兩個資料行，名為 Binary Class Scored Labels 和 Binary Class Scored Probabilities，分別代表評分標籤和機率。
- 針對多重分類工作，要評估的資料集必須有一個名為 Multi Class Scored Labels 的資料行，代表評分標籤。
請注意，無法直接評估「為 Vowpal Wabbit 模型評分」元件的結果。在評估之前，請根據上述需求來修改資料集。

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

參數

Vowpal Wabbit 有許多命令列選項可用於選擇和微調演算法。這裡無法提供這些選項的完整討論；建議您檢視 Vowpal Wabbit wiki 頁面。

Azure Machine Learning 工作室 (傳統) 中不支援下列參數。

https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的輸入/輸出選項

元件已自動設定這些屬性。
此外，也不允許產生多個輸出或接受多個輸入的任何選項。其中包括 --cbt、--lda 和 --wap。
僅支援受監督的學習演算法。這不允許下列選項：–active、--rank、--search 等等。

上述引數以外的所有引數則允許使用。

後續步驟

請參閱 Azure Machine Learning 可用的元件集。

計分 Vowpal Wabbit 模型

如何設定「為 Vowpal Wabbit 模型評分」

結果

技術說明

參數

後續步驟

其他資源