選取資料行轉換

本文描述如何使用 Azure Machine Learning 設計工具中的「選取資料行轉換」元件。 「選取資料行」轉換元件的目的是要確保下游機器學習作業中使用一組可預測且一致的資料行。

此元件對於需要特定資料行的工作 (例如評分) 很有幫助。 可用資料行中的變更可能會中斷管線或變更結果。

您可以使用「選取資料行轉換」來建立和儲存一組資料行。 然後,使用套用轉換元件將這些選取項目套用至新的資料。

如何使用選取資料行轉換

本案例假設您想要使用特徵選取來產生一組動態資料行,以用來訓練模型。 為確保用於評分程序的資料行選取都相同,您可以使用「選取資料行轉換」元件來擷取資料行選取項目,並將其套用至管線中的其他位置。

  1. 在設計工具中,將輸入資料集新增至您的管線。

  2. 針對篩選式特徵選取新增執行個體。

  3. 連結元件,並設定特徵選取元件,以自動尋找輸入資料集中的多個最佳特徵。

  4. 新增訓練模型的執行個體,並使用篩選式特徵選取的輸出作為訓練的輸入。

    重要

    因為特徵重要度以據資料行中的值為依據,所以您無法事先知道哪些資料行可用來作為訓練模型的輸入。

  5. 附加「選取資料行轉換」元件的執行個體。

    此步驟會以轉換的形式產生資料行選取,其可儲存或套用到其他資料集。 此步驟可確保特徵選取中所識別的資料行都會儲存,以供其他元件重複使用。

  6. 新增評分模型元件。

    請勿連結輸入資料集。 相反地,請新增套用轉換元件,並連結特徵選取轉換的輸出。

    管線結構應如下所示:

    範例管線

    重要

    篩選式特徵選取套用至評分資料集,並不一定會得到相同的結果。 因為特徵選取是以值為基礎,所以其可能會選擇一組不同的資料行,而這會導致評分作業失敗。

  7. 提交管線。

儲存然後套用資料行選取的此程序,可確保用於訓練和評分的資料結構描述相同。

後續步驟

請參閱 Azure Machine Learning 可用的元件集