在 Machine Learning Studio (傳統) 中解譯模型結果

發行項
11/29/2017

適用於： 這是核取記號，表示此文章適用於 Machine Learning Studio (傳統)。 Machine Learning Studio (傳統) 這是 X，表示此文章不適用於 Azure Machine Learning。 Azure Machine Learning

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。建議您在該日期之前轉換成 Azure Machine Learning。

自 2021 年 12 月 1 日起，您將無法建立新的 Machine Learning 工作室 (傳統) 資源。在 2024 年 8 月 31 日之前，您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

請參閱將機器學習專案從 ML 工作室 (傳統) 移至 Azure Machine Learning 的相關資訊。
深入了解 Azure Machine Learning

ML 工作室 (傳統) 文件即將淘汰，未來將不再更新。

此主題說明如何視覺化和解譯 Machine Learning Studio (傳統) 中的預測結果。在您訓練好模型並完成其預測 (「模型評分」) 之後，您必須了解和解譯預測結果。

Machine Learning Studio (傳統) 中有四個主要的機器學習模型：

分類
叢集
迴歸
推薦系統

用來預測這些模型的模組如下︰

評分模型模組，用於分類和迴歸
指派至叢集模組，用於加入叢集
評分 Matchbox 推薦，用於推薦系統

了解如何選擇參數來最佳化 ML Studio (傳統) 中的演算法。

若要了解如何評估模型，請參閱如何評估模型效能。

如果您不熟悉 ML Studio (傳統)，請了解如何建立簡單的實驗。

分類

分類問題方面有兩個子類別：

只有兩個分類的問題 (雙類別或二進位分類)
兩個以上分類的問題 (多類別分類)

Machine Learning Studio (傳統) 有不同的模組可以處理這些類型的分類，但解譯其預測結果的方法類似。

雙類別分類

範例實驗

雙類別分類問題的範例是鳶尾花的分類。作法是根據特徵來分類鳶尾花。 Machine Learning Studio (傳統) 中提供的鳶尾花資料集是熱門鳶尾花資料集的子集，僅包含兩個花卉物種 (類別 0 和 1) 的執行個體。每個花卉有四個特徵 (萼片長度、萼片寬度、花瓣長度及花瓣寬度)。

鳶尾花實驗的螢幕擷取畫面

圖 1. 鳶尾花雙類別分類問題實驗

已執行實驗以解決此問題，如「圖 1」所示。已訓練及評分雙類別促進式決策樹模型。您現在可以從評分模型模組將預測結果視覺化，方法是按一下評分模型模組的輸出連接埠，然後按一下 [視覺化]。

評分模型模組

這樣會帶出評分結果，如圖 2 所示。

鳶尾花雙類別分類實驗的結果

圖 2. 視覺化雙類別分類中的評分模型結果

結果解譯

結果資料表中有六個資料行。左側四個資料行是四個特徵。右側兩個資料行 (「評分標籤」和「評分機率」) 是預測結果。「評分機率」資料行顯示花卉屬於正類別 (類別 1) 的機率。例如，資料行中的第一個數字 (0.028571) 表示第一個花卉屬於類別 1 的機率有 0.028571。「評分標籤」資料行顯示每個花卉的預測類別。這是根據「評分機率」資料行。如果花卉的評分機率大於 0.5，則會預測為類別 1。否則會預測為類別 0。

Web 服務發佈

了解預測結果並且完全評判之後，可以將實驗發佈為 Web 服務，以便您在各種應用程式中進行部署及呼叫，以取得任何新的鳶尾花的類別預測。若要了解如何將定型實驗變更為評分實驗並將其發佈為 Web 服務，請參閱教學課程 3：部署信用風險模型。此程序可提供給您如圖 3 所示的評分實驗。

評分實驗的螢幕擷取畫面

圖 3. 鳶尾花雙類別分類問題實驗評分

您現在必須設定 Web 服務的輸入和輸出。輸入是評分模型的右側輸入連接埠，這是鳶尾花的特徵輸入。輸出的選擇取決於您是對於預測類別 (評分標籤)、評分機率或兩者感到興趣。此範例假設您對兩者都感到興趣。若要選取想要的輸出資料行，請使用選取資料集中的資料行模組。依序按一下選取資料集中的資料行和 啟動資料行選取器，然後選取 [評分標籤] 和 [評分機率]。設定選取資料集中的資料行的輸出連接埠並再次執行之後，您應該就可以按一下 [發佈 WEB 服務]，將評分實驗發佈為 Web 服務。最終實驗如「圖 4」所示。

鳶尾花雙類別分類實驗

圖 4. 鳶尾花雙類別分類問題的最終評分實驗

執行 Web 服務並且輸入測試執行個體的一些特徵值之後，結果會傳回兩個數字。第一個數字是評分標籤，而第二個數字是評分機率。此花卉預測為類別 1，其機率為 0.9655。

測試解譯評分模型

測試結果評分

圖 5. 鳶尾花雙類別分類的 Web 服務結果

多類別分類

範例實驗

在此實驗中，您將執行字母辨識工作，做為多元分類的範例。分類器會嘗試根據一些從手寫影像中擷取的手寫屬性值，預測特定字母 (類別)。

字母辨識範例

在定型資料中，有 16 個擷取自手寫字母影像的特徵。 26 個字母形成 26 個類別。圖 6 顯示的實驗將以訓練多元分類模型進行字母辨識，並在測試資料集上針對相同的特徵集進行預測。

字母辨識多類別分類實驗

圖 6. 字母辨識多類別分類問題實驗

從評分模型模組將結果視覺化，方法是按一下評分模型模組的輸出連接埠，然後按一下 [視覺化]，您應會看見如圖 7 所示的內容。

評分模型模組

圖 7. 視覺化多類別分類中的評分模型結果

結果解譯

左側 16 個資料行代表測試集的特徵值。類別 "XX" 之名稱為「評分機率」之類的資料行，就像是雙類別案例的「評分機率」資料行。它們會顯示對應項目落在特定類別的機率。例如，對於第一個項目，有 0.003571 的機率是 "A"，有 0.000451 的機率是 "B"，依此類推。最後的資料行 (評分標籤) 與雙類別案例的「評分標籤」相同。它會選取具有最大評分機率的類別做為對應項目的預測類別。例如，對於第一個項目，評分標籤為 "F"，因為其最大機率是 "F" (0.916995)。

Web 服務發佈

您也可以取得每個項目的評分標籤以及評分標籤的機率。基本邏輯是尋找所有評分機率當中最大的機率。若要這麼做，您需要使用執行 R 指令碼模組。 R 程式碼如圖 8 所示，實驗的結果如圖 9 所示。

R 程式碼範例

圖 8. R 程式碼，用以擷取評分標籤和標籤的相關聯機率

實驗結果

圖 9. 字母辨識多類別分類問題的最終評分實驗

發佈及執行 Web 服務並輸入一些輸入特徵值之後，傳回的結果如圖 10 所示。此手寫字母具有其擷取的 16 個特徵，預測為 "T" 的機率是 0.9715。

測試解譯評分模組

測試結果

圖 10. 多類別分類的 Web 服務結果

迴歸

迴歸問題與分類問題不同。在分類問題中，您會嘗試預測離散案例，例如鳶尾花屬於哪個類別。但如以下迴歸問題範例所示，您會嘗試預測連續變數，例如汽車的價格。

範例實驗

使用汽車價格預測做為您的迴歸範例。您會嘗試根據汽車的特徵預測其價格，例如製造、燃料類型、車體類型和驅動輪。實驗如「圖 11」所示。

汽車價格迴歸實驗

圖 11. 汽車價格迴歸問題實驗

視覺化評分模型模組，結果如圖 12 所示。

汽車價格預測問題的評分結果

圖 12. 汽車價格預測問題的評分結果

結果解譯

「評分標籤」是此評分結果中的結果資料行。數字是每部汽車的預測價格。

Web 服務發佈

您可以將迴歸實驗發佈至 Web 服務，並且針對汽車價格預測呼叫，方式與雙類別分類使用案例中的方式相同。

汽車價格迴歸問題的評分實驗

圖 13. 汽車價格迴歸問題的評分實驗

執行 Web 服務，傳回的結果如「圖 14」所示。此汽車的預測價格為 $15,085.52。

測試解譯評分模組

評分模組結果

圖 14. 汽車價格迴歸問題的 Web 服務結果

叢集

範例實驗

讓我們再次使用鳶尾花資料集來建置叢集實驗。您可以在這裡篩選資料集中的類別標籤，使其僅具有特徵並可用於叢集。在此鳶尾花使用案例中，將訓練處理期間的叢集數指定為 2，表示您想要將花卉叢集為兩個類別。實驗如「圖 15」所示。

鳶尾花叢集問題實驗

圖 15. 鳶尾花叢集問題實驗

叢集與分類的不同之處在於定型資料集本身沒有實況標籤。將訓練資料集執行個體群組至不同的叢集。在訓練處理期間，模型會為項目加上標籤，方法是學習其特徵之間的差異。之後，定型模型可進一步用來分類未來的項目。在叢集問題當中，我們感興趣的結果有兩個部分。第一個部分是為訓練資料集加上標籤，而第二個部分是使用定型模型來分類新的資料集。

您可以按一下訓練叢集模型的左側輸出連接埠，然後按一下 [視覺化]，將結果的第一個部分視覺化。視覺化如圖 16 所示。

叢集結果

圖 16. 視覺化訓練資料集的叢集結果

結果的第二個部分，使用已訓練的叢集模型叢集新的項目，如「圖 17」所示。

視覺化叢集結果

圖 17. 視覺化新資料集的叢集結果

結果解譯

雖然兩個部分的結果出自於不同的實驗階段，但是其外觀相同，並且是以相同的方式進行解譯。前面四個資料行是特徵。最後一個資料行 (指派) 是預測結果。已指派相同數字的項目預測為在相同叢集中，也就是說，它們某種程度上有相似之處 (此實驗使用預設的歐幾里德距離度量)。因為您將叢集數目指定為 2，則 [指派] 中的項目會標示為 0 或 1。

Web 服務發佈

您可以將叢集實驗發佈至 Web 服務，並且針對叢集預測呼叫，方式與雙類別分類使用案例中的方式相同。

鳶尾花叢集問題的評分實驗