判定樹系回歸元件
本文說明 Azure 機器學習 設計工具中的元件。
使用此元件根據判定樹的合奏來建立回歸模型。
設定模型之後,您必須使用加上標籤的數據集和 定型模型元件來定型模型 。 然後,定型的模型可以用來進行預測。
運作方式
判定樹是非參數模型,會針對每個實例執行一系列簡單的測試,並周遊二進位樹狀結構,直到到達分葉節點(決策)為止。
判定樹具有下列優點:
在定型和預測期間,執行運算和記憶體使用都很有效率。
可以代表非線性決策界限。
它們會執行整合式特徵選取和分類,並在出現嘈雜功能時具有彈性。
此回歸模型是由判定樹的合奏所組成。 回歸判定樹系中的每個樹狀結構都會輸出 Gaussian 分佈做為預測。 系統會對樹狀結構整體執行彙總,以找出最接近模型中所有樹狀結構合併分佈的高斯分佈。
如需此演算法理論架構及其實作的詳細資訊,請參閱這篇文章: 判定樹系:分類、回歸、密度估計、Manifold Learning 和半監督式學習的整合架構
如何設定判定樹系回歸模型
將 判定樹系回歸 元件新增至管線。 您可以在設計工具的 [機器學習]、[初始化模型] 和 [回歸] 下找到元件。
開啟元件屬性,然後針對 Resampling 方法,選擇用來建立個別樹狀結構的方法。 您可以選擇 [Bagging ] 或 [複寫]。
嘮叨:Bagging 也稱為 啟動程序匯總。 回歸判定樹系中的每個樹狀結構都會透過預測方式輸出 Gaussian 分佈。 匯總是尋找高斯,其前兩個時刻符合高斯分佈混合的時刻,結合個別樹狀結構傳回的所有分佈。
如需詳細資訊,請參閱Bootstrap匯總的維琪百科專案。
復寫:在複寫中,每個樹狀結構都會在完全相同的輸入數據上定型。 每個樹狀節點會使用哪一個分割述詞的判斷是隨機的,而且樹狀結構會多樣化。
如需使用復寫選項定型程式的詳細資訊,請參閱用於 電腦視覺 和醫學影像分析的判定樹系。西卡西和J.肖頓。Springer 2013..
藉由設定 [建立定型定型器模式 ] 選項,指定您要如何定型模型。
單一參數
如果您知道如何設定模型,則可以提供一組特定的值做為自變數。 您可能已透過實驗來了解這些值,或收到這些值作為指引。
參數範圍:如果您不確定最佳參數,而且想要執行參數掃掠,請選取此選項。 選取要逐一查看的值範圍,而 微調模型超參數 會逐一查看您提供之設定的所有可能組合,以判斷產生最佳結果的超參數。
針對 判定樹數目,表示在合奏中建立的判定樹總數。 藉由建立更多判定樹,您可能會獲得更好的涵蓋範圍,但定型時間將會增加。
提示
如果您將值設定為 1;不過,這表示只會產生一個樹狀結構(具有初始參數集的樹狀結構),而且不會再執行任何反覆專案。
針對 判定樹的最大深度,輸入數位以限制任何判定樹的最大深度。 增加樹狀結構的深度可能會增加精確度,但有一些過度學習和增加訓練時間的風險。
針對 [ 每個節點隨機分割數目],輸入建置樹狀結構每個節點時要使用的分割數目。 分割表示樹狀結構(節點)每個層級的功能會隨機分割。
針對 每個分葉節點的樣本數目下限,表示樹狀結構中建立任何終端節點(分葉)所需的最小案例數目。
藉由增加此值,您可以增加建立新規則的臨界值。 例如,預設值為 1,即使是單一案例,也會導致建立新的規則。 如果您將值增加至 5,定型數據必須包含至少五個符合相同條件的案例。
定型模型:
如果您將 [建立定型器模式] 設定為 [單一參數],請連接已標記的數據集和定型模型元件。
如果您將 [建立定型器模式] 設定為 [參數範圍],請使用 [微調模型超參數] 連接已標記的數據集並定型模型。
提交管線。
結果
完成定型之後:
- 若要儲存定型模型的快照集,請選取定型元件,然後在右側面板中切換至 [輸出 ] 索引卷標。 按兩下圖示 [註冊模型]。 您可以在元件樹狀結構中找到已儲存的模型作為元件。