教學課程:在 Power BI 中建置機器學習模型
重要
我們已淘汰為資料流程 v1 建立 Power BI 自動化機器學習 (AutoML) 模型的流程,未來將不再提供。 建議客戶將解決方案移轉到 Microsoft Fabric 中的 AutoML 功能。 如需詳細資訊,請參閱淘汰公告 (英文)。
在本教學課程中,您會使用「自動化機器學習」,在 Power BI 中建立並套用二元預測模型。 您會建立 Power BI 資料流程,並使用您在資料流程中定義的實體,直接在 Power BI 中定型及驗證機器學習模型。 您接著會使用該模型來為新資料評分並產生預測。
首先,您會建立二元預測機器學習模型,根據線上購物者的一組線上工作階段屬性,預測其購買意圖。 您會在此練習中使用效能評定機器學習語意模型。 定型模型之後,Power BI 會自動產生驗證報表來說明模型結果。 您接著可以檢視驗證報表,並將模型套用到您的資料以進行評分。
本教學課程包含下列步驟:
- 使用輸入資料建立資料流程。
- 建立並定型機器學習模型。
- 檢閱模型驗證報表。
- 將模型套用到資料流程實體。
- 在 Power BI 報表中使用模型的評分輸出。
使用輸入資料建立資料流程
請依照下列步驟,使用輸入資料建立資料流程。
取得 資料
建立資料流程的第一個步驟,是將您的資料來源準備就緒。 在此案例中,您會使用來自一組線上工作階段的機器學習語意模型,其中有些最後會形成購買。 語意模型包含一組與這些工作階段相關的屬性,而您會使用這些屬性來定型您的模型。
您可以從 UC Irvine 網站或透過下載 online_shoppers_intention.csv 來下載語意模型。 在本教學課程稍後,您會透過指定語意模型的 URL 來連線到語意模型。
建立資料表
若要在您的資料流程中建立實體,請登入 Power BI 服務,並瀏覽至工作區。
如果您沒有工作區,請在 Power BI 左側瀏覽窗格中選取 [工作區],然後選取 [建立工作區] 以建立一個工作區。 在 [建立工作區] 面板中輸入工作區名稱,然後選取 [儲存]。
在新工作區頂端選取 [新增],然後選取 [資料流程]。
選取 [新增資料表] 以在瀏覽器中啟動 Power Query 編輯器。
在 [選擇資料來源] 畫面上,選取 [文字/CSV] 作為資料來源。
在 [連線到資料來源] 頁面上,將下列 online_shoppers_intention.csv 檔案的連結貼入 [檔案路徑或 URL] 方塊,然後選取 [下一步]。
https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv
Power Query 編輯器會從 CSV 檔案中顯示資料的預覽。 若要在載入資料之前變更資料,請選取 [轉換資料]。
Power Query 會自動推斷資料行的資料類型。 您可以選取資料行標頭頂端的屬性類型圖示來變更資料類型。 將 [Revenue] 資料行的類型變更為 [True/False]。
您可以變更右窗格中 [名稱] 方塊內的值,將查詢重新命名為較易記的名稱。 將查詢名稱變更為「線上訪客」。
選取 [儲存並關閉],並在對話方塊中為資料流程提供名稱,然後選取 [儲存]。
建立及定型機器學習模型
若要新增機器學習模型:
在包含您定型資料和標籤資訊的資料表 [動作] 清單中,選取套用 ML 模型圖示,然後選取 [新增機器學習模型]。
建立您機器學習模型的第一個步驟是識別歷史資料,包括您想要預測的結果欄位。 模型的建立從學習此資料而來。 在此案例中,您想要預測訪客是否會進行購買。 您想要預測的結果位於 [Revenue] 欄位中。 選取 [Revenue] 作為 [結果欄位] 值,然後選取 [下一步]。
接下來,您會選取要建立的機器學習模型類型。 Power BI 會分析您所識別結果欄位中的值,並建議可建立以預測該欄位的機器學習模型類型。
在此案例中,由於您想要預測訪客是否進行購買的二元結果,因此 Power BI 會建議 [二元預測]。 由於您有興趣預測要進行購買的訪客,因此請在 [選擇目標結果] 下選取 [true]。 您也可以提供不同的標籤,以用於表示摘要模型驗證結果之自動產生報表中的各種結果。 然後選取下一步。
Power BI 會對資料範例進行初步掃描,並建議可能產生更正確預測的輸入。 如果 Power BI 未建議資料行,則會在資料行旁說明未建議的原因。 您可以選取或取消選取資料行名稱旁的核取方塊來變更選取項目,只包含您希望模型研究的欄位。 選取 [下一步],接受輸入。
在最後一個步驟中,將模型命名為「購買意圖預測」,然後選擇要花在定型的時間量。 您可以減少定型時間來更快看到結果,或增加時間來取得最佳模型。 然後選取 [儲存並定型] 來開始定型模型。
如果您收到類似 [找不到資料來源的認證] 的錯誤,您必須更新認證,Power BI 才能為資料評分。 若要更新您的認證,請選取標頭列中的 [更多選項...],然後選取 [設定]>[設定]。
在 [資料流程] 下選取您的資料流程,展開 [資料來源認證],然後選取 [編輯認證]。
追蹤定型狀態
定型流程一開始會先取樣和正規化您的歷史資料,並將您的語意模型分成兩個新實體:「購買意圖預測定型資料」及「購買意圖預測測試資料」。
取決於語意模型的大小,定型流程所花費時間可能自數分鐘到您選取的定型時間不等。 您可以透過資料流程的狀態來確認模型正在定型或正在進行驗證。 此狀態會在工作區的 [語意模型 + 資料流程] 索引標籤中,顯示為正在進行的資料重新整理。
您可以在資料流程的 [機器學習模型] 索引標籤中看到此模型。 [狀態] 表示模型已排入定型佇列、正在定型或已定型。 模型定型完成後,資料流程會顯示更新後的 [上次定型時間] 和 [已定型] 狀態。
檢閱模型驗證報表
若要檢閱模型驗證報表,請在 [機器學習模型] 索引標籤中,選取 [動作] 下的檢視定型報表圖示。 此報表會描述您機器學習模型可能執行的方式。
在報表的 [模型效能] 頁面中,選取 [查看最高預測指標] 以檢視您模型的最高預測指標。 您可以選取其中一個預測指標來查看結果分佈與該預測指標建立關聯的方式。
您可以使用 [模型效能] 頁面上的 [可能性閾值] 交叉分析篩選器,在模型上檢查對模型 [精確度] 和 [召回率] 的影響。
報表的其他頁面會描述模型的統計效能計量。
此報表還包含 [定型詳細資料] 頁面,其中描述 [反覆運算回合]、從輸入擷取特徵的方式,以及 [使用的最終模型] 的超參數。
將模型套用到資料流程實體
選取報表頂端的 [套用模型] 按鈕來叫用此模型。 在 [套用] 對話方塊中,您可以指定要套用模型之擁有來源資料的目標實體。 然後選取 [儲存並套用]。
套用模型會建立以「擴充 <模型名稱>」和「擴充 <模型名稱> 說明」結尾的兩個新實體。 在此案例中,將模型套用至 [線上訪客] 資料表會建立:
- 線上訪客擴充購買意圖預測,其中包含模型的預測輸出。
- 線上訪客擴充購買意圖預測說明,其中包含預測的主要記錄特定影響因素。
套用二元預測模型會新增四個資料行 ([Outcome]、[PredictionScore]、[PredictionExplanation] 和 [ExplanationIndex]),每個資料行都會以「購買意圖預測」開頭。
在完成資料流程重新整理後,您可以選取 [線上訪客擴充購買意圖預測] 資料表來檢視結果。
您也可以在資料流程中,直接從 Power Query 編輯器叫用工作區中的任何自動化機器學習模型。 若要存取自動化機器學習模型,請針對您要使用自動化機器學習模型見解擴充的資料表選取 [編輯]。
在 Power Query 編輯器的功能區中選取 [AI 見解]。
在 [AI 見解] 畫面上,從瀏覽窗格選取 [Power BI Machine Learning Models] 資料夾。 此清單會顯示您有權存取的所有機器學習模型作為 Power Query 函式。 機器學習模型的輸入參數會自動對應為相對應 Power Query 函式的參數。 只有在參數的名稱和資料類型相同時,才會自動對應參數。
若要叫用機器學習模型,您可以選取所選模型的任一資料行作為下拉式清單中的輸入。 您也可以切換輸入行旁的資料行圖示來指定要作為輸入的常數值。
選取 [套用],以檢視機器學習模型輸出作為資料表中新資料行的預覽。 您也會在查詢的 [套用的步驟] 下看到模型叫用。
儲存資料流程之後,當針對實體資料表中任何新的或更新的資料列重新整理資料流程時,將會自動叫用模型。
在 Power BI 報表中使用模型的評分輸出
若要使用機器學習模型的評分輸出,您可以使用 [資料流程] 連接器,從 Power BI Desktop 連線到您的資料流程。 您現在可以使用 [線上訪客擴充購買意圖預測] 資料表,將模型的預測納入 Power BI 報表。
限制
搭配自動化機器學習使用閘道有一些已知問題。 如果需要使用閘道,最好先透過閘道建立匯入必要資料的資料流程。 然後,建立另一個資料流程,使其參考第一個資料流程,以建立或套用這些模型。
如果 AI 在資料流程無法運作,您可能需要在將 AI 用於資料流程時,啟用 [快速合併]。 在匯入資料表後、開始新增 AI 功能「之前」,從 [首頁] 功能區中選取 [選項],然後在出現的視窗中,選取 [允許合併多個來源的資料] 旁的核取方塊,以啟用功能,再選取 [確定] 以儲存選取項目。 之後,便可以將 AI 功能新增至資料流程。
相關內容
在本教學課程中,您已執行下列步驟,在 Power BI 中建立並套用二元預測模型:
- 已使用輸入資料建立資料流程。
- 已建立並定型機器學習模型。
- 已檢閱模型驗證報表。
- 已將模型套用到資料流程實體。
- 已了解如何在 Power BI 報表中使用模型的評分輸出。
如需 Power BI 中機器學習自動化的詳細資訊,請參閱 Power BI 中的自動化機器學習。