計分 Vowpal Wabbit 模型
本文描述如何在 Azure Machine Learning 設計工具中使用為 Vowpal Wabbit 模型評分元件,利用現有的已定型 Vowpal Wabbit 模型來為一組輸入資料產生分數。
此元件會提供最新版的 Vowpal Wabbit 架構 (8.8.1 版)。 您可以使用此元件,利用以 VW 第 8 版格式儲存的已定型模型來為資料評分。
如何設定「為 Vowpal Wabbit 模型評分」
將 [為 Vowpal Wabbit 模型評分] 元件新增至您的實驗。
新增已定型的 Vowpal Wabbit 模型,並將其連線到左側的輸入埠。 您可以使用在相同實驗中建立的已定型模型,或在設計工具左邊瀏覽窗格的 [資料集] 類別中找出已儲存的模型。 不過,該模型必須可於 Azure Machine Learning 設計工具中使用。
注意
只支援 Vowpal Wabbit 8.8.1 模型;您無法將使用其他演算法來定型的已儲存模型連線。
新增測試資料集,並將其連線到右邊的輸入埠。 如果測試資料集是包含測試資料檔案的目錄,請以測試資料檔案的名稱指定測試資料檔案名稱。 如果測試資料集是單一檔案,請讓 [測試資料檔案的名稱] 保持空白。
在 [VW 引數] 文字方塊中,輸入一組對 Vowpal Wabbit 可執行檔有效的命令列引數。
如需 Azure Machine Learning 中支援和不支援哪些 Vowpal Wabbit 引數的相關資訊,請參閱技術說明一節。
測試資料檔案的名稱:輸入包含輸入資料的檔案名稱。 僅在測試資料集是目錄時,才會使用這個引數。
指定檔案類型:指出定型資料所使用的格式。 Vowpal Wabbit 支援這兩個輸入檔案格式:
- VW 代表 Vowpal Wabbit 所使用的內部格式。 如需詳細資料,請參閱 Vowpal Wabbit Wiki 頁面。
- SVMLight 是其他一些機器學習工具所使用的格式。
如果您想要一起輸出標籤與分數,請選取 [加入包含標籤的額外資料行] 選項。
一般來說,在處理文字資料時,Vowpal Wabbit 不需要標籤,而且只會傳回每個資料列的分數。
如果您想要一起輸出原始分數與結果,請選取 [加入包含原始分數的額外資料行] 選項。
提交管線。
結果
定型完成後:
若要以視覺化方式呈現結果,請以滑鼠右鍵按一下為 Vowpal Wabbit 模型評分元件的輸出。 該輸出會指出已正規化為 0 到 1 的預測分數。
若要評估結果,輸出資料集應該包含符合評估模型元件需求的特定分數資料行名稱。
- 針對迴歸工作,要評估的資料集必須有一個名為
Regression Scored Labels
的資料行,其代表評分標籤。 - 針對二元分類工作,要評估的資料集必須有兩個資料行,名為
Binary Class Scored Labels
和Binary Class Scored Probabilities
,分別代表評分標籤和機率。 - 針對多重分類工作,要評估的資料集必須有一個名為
Multi Class Scored Labels
的資料行,代表評分標籤。
請注意,無法直接評估「為 Vowpal Wabbit 模型評分」元件的結果。 在評估之前,請根據上述需求來修改資料集。
- 針對迴歸工作,要評估的資料集必須有一個名為
技術說明
本節包含實作詳細資料、提示和常見問題集的解答。
參數
Vowpal Wabbit 有許多命令列選項可用於選擇和微調演算法。 這裡無法提供這些選項的完整討論;建議您檢視 Vowpal Wabbit wiki 頁面。
Azure Machine Learning 工作室 (傳統) 中不支援下列參數。
https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的輸入/輸出選項
元件已自動設定這些屬性。
此外,也不允許產生多個輸出或接受多個輸入的任何選項。 其中包括
--cbt
、--lda
和--wap
。僅支援受監督的學習演算法。 這不允許下列選項:
–active
、--rank
、--search
等等。
上述引數以外的所有引數則允許使用。
後續步驟
請參閱 Azure Machine Learning 可用的元件集。