計分 Vowpal Wabbit 模型

本文描述如何在 Azure Machine Learning 設計工具中使用為 Vowpal Wabbit 模型評分元件,利用現有的已定型 Vowpal Wabbit 模型來為一組輸入資料產生分數。

此元件會提供最新版的 Vowpal Wabbit 架構 (8.8.1 版)。 您可以使用此元件,利用以 VW 第 8 版格式儲存的已定型模型來為資料評分。

如何設定「為 Vowpal Wabbit 模型評分」

  1. 將 [為 Vowpal Wabbit 模型評分] 元件新增至您的實驗。

  2. 新增已定型的 Vowpal Wabbit 模型,並將其連線到左側的輸入埠。 您可以使用在相同實驗中建立的已定型模型,或在設計工具左邊瀏覽窗格的 [資料集] 類別中找出已儲存的模型。 不過,該模型必須可於 Azure Machine Learning 設計工具中使用。

    注意

    只支援 Vowpal Wabbit 8.8.1 模型;您無法將使用其他演算法來定型的已儲存模型連線。

  3. 新增測試資料集,並將其連線到右邊的輸入埠。 如果測試資料集是包含測試資料檔案的目錄,請以測試資料檔案的名稱指定測試資料檔案名稱。 如果測試資料集是單一檔案,請讓 [測試資料檔案的名稱] 保持空白。

  4. 在 [VW 引數] 文字方塊中,輸入一組對 Vowpal Wabbit 可執行檔有效的命令列引數。

    如需 Azure Machine Learning 中支援和不支援哪些 Vowpal Wabbit 引數的相關資訊,請參閱技術說明一節。

  5. 測試資料檔案的名稱:輸入包含輸入資料的檔案名稱。 僅在測試資料集是目錄時,才會使用這個引數。

  6. 指定檔案類型:指出定型資料所使用的格式。 Vowpal Wabbit 支援這兩個輸入檔案格式:

    • VW 代表 Vowpal Wabbit 所使用的內部格式。 如需詳細資料,請參閱 Vowpal Wabbit Wiki 頁面
    • SVMLight 是其他一些機器學習工具所使用的格式。
  7. 如果您想要一起輸出標籤與分數,請選取 [加入包含標籤的額外資料行] 選項。

    一般來說,在處理文字資料時,Vowpal Wabbit 不需要標籤,而且只會傳回每個資料列的分數。

  8. 如果您想要一起輸出原始分數與結果,請選取 [加入包含原始分數的額外資料行] 選項。

  9. 提交管線。

結果

定型完成後:

  • 若要以視覺化方式呈現結果,請以滑鼠右鍵按一下為 Vowpal Wabbit 模型評分元件的輸出。 該輸出會指出已正規化為 0 到 1 的預測分數。

  • 若要評估結果,輸出資料集應該包含符合評估模型元件需求的特定分數資料行名稱。

    • 針對迴歸工作,要評估的資料集必須有一個名為 Regression Scored Labels 的資料行,其代表評分標籤。
    • 針對二元分類工作,要評估的資料集必須有兩個資料行,名為 Binary Class Scored LabelsBinary Class Scored Probabilities,分別代表評分標籤和機率。
    • 針對多重分類工作,要評估的資料集必須有一個名為 Multi Class Scored Labels 的資料行,代表評分標籤。

    請注意,無法直接評估「為 Vowpal Wabbit 模型評分」元件的結果。 在評估之前,請根據上述需求來修改資料集。

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

參數

Vowpal Wabbit 有許多命令列選項可用於選擇和微調演算法。 這裡無法提供這些選項的完整討論;建議您檢視 Vowpal Wabbit wiki 頁面

Azure Machine Learning 工作室 (傳統) 中不支援下列參數。

  • https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的輸入/輸出選項

    元件已自動設定這些屬性。

  • 此外,也不允許產生多個輸出或接受多個輸入的任何選項。 其中包括 --cbt--lda--wap

  • 僅支援受監督的學習演算法。 這不允許下列選項:–active--rank--search 等等。

上述引數以外的所有引數則允許使用。

後續步驟

請參閱 Azure Machine Learning 可用的元件集