判定樹系回歸元件

發行項
09/02/2024

本文說明 Azure 機器學習設計工具中的元件。

使用此元件根據判定樹的合奏來建立回歸模型。

設定模型之後，您必須使用加上標籤的數據集和定型模型元件來定型模型。然後，定型的模型可以用來進行預測。

運作方式

判定樹是非參數模型，會針對每個實例執行一系列簡單的測試，並周遊二進位樹狀結構，直到到達分葉節點（決策）為止。

判定樹具有下列優點：

在定型和預測期間，執行運算和記憶體使用都很有效率。
可以代表非線性決策界限。
它們會執行整合式特徵選取和分類，並在出現嘈雜功能時具有彈性。

此回歸模型是由判定樹的合奏所組成。回歸判定樹系中的每個樹狀結構都會輸出 Gaussian 分佈做為預測。系統會對樹狀結構整體執行彙總，以找出最接近模型中所有樹狀結構合併分佈的高斯分佈。

如需此演算法理論架構及其實作的詳細資訊，請參閱這篇文章：判定樹系：分類、回歸、密度估計、Manifold Learning 和半監督式學習的整合架構

如何設定判定樹系回歸模型

將 判定樹系回歸 元件新增至管線。您可以在設計工具的 [機器學習]、[初始化模型] 和 [回歸] 下找到元件。
開啟元件屬性，然後針對 Resampling 方法，選擇用來建立個別樹狀結構的方法。您可以選擇 [Bagging ] 或 [複寫]。
- 嘮叨：Bagging 也稱為 啟動程序匯總。回歸判定樹系中的每個樹狀結構都會透過預測方式輸出 Gaussian 分佈。匯總是尋找高斯，其前兩個時刻符合高斯分佈混合的時刻，結合個別樹狀結構傳回的所有分佈。
  
  如需詳細資訊，請參閱Bootstrap匯總的維琪百科專案。
- 復寫：在複寫中，每個樹狀結構都會在完全相同的輸入數據上定型。每個樹狀節點會使用哪一個分割述詞的判斷是隨機的，而且樹狀結構會多樣化。
  
  如需使用復寫選項定型程式的詳細資訊，請參閱用於電腦視覺和醫學影像分析的判定樹系。西卡西和J.肖頓。Springer 2013..
藉由設定 [建立定型定型器模式 ] 選項，指定您要如何定型模型。
- 單一參數
  
  如果您知道如何設定模型，則可以提供一組特定的值做為自變數。您可能已透過實驗來了解這些值，或收到這些值作為指引。
- 參數範圍：如果您不確定最佳參數，而且想要執行參數掃掠，請選取此選項。選取要逐一查看的值範圍，而微調模型超參數會逐一查看您提供之設定的所有可能組合，以判斷產生最佳結果的超參數。
針對 判定樹數目，表示在合奏中建立的判定樹總數。藉由建立更多判定樹，您可能會獲得更好的涵蓋範圍，但定型時間將會增加。

提示

如果您將值設定為 1;不過，這表示只會產生一個樹狀結構（具有初始參數集的樹狀結構），而且不會再執行任何反覆專案。
針對 判定樹的最大深度，輸入數位以限制任何判定樹的最大深度。增加樹狀結構的深度可能會增加精確度，但有一些過度學習和增加訓練時間的風險。
針對 [ 每個節點隨機分割數目]，輸入建置樹狀結構每個節點時要使用的分割數目。分割表示樹狀結構（節點）每個層級的功能會隨機分割。
針對 每個分葉節點的樣本數目下限，表示樹狀結構中建立任何終端節點（分葉）所需的最小案例數目。

藉由增加此值，您可以增加建立新規則的臨界值。例如，預設值為 1，即使是單一案例，也會導致建立新的規則。如果您將值增加至 5，定型數據必須包含至少五個符合相同條件的案例。
定型模型：
- 如果您將 [建立定型器模式] 設定為 [單一參數]，請連接已標記的數據集和定型模型元件。
- 如果您將 [建立定型器模式] 設定為 [參數範圍]，請使用 [微調模型超參數] 連接已標記的數據集並定型模型。
注意

如果您將參數範圍傳遞至定型模型，它只會使用單一參數清單中的預設值。

如果您將單一參數值集合傳遞至微調模型超參數位件，當它預期每個參數的設定範圍時，它會忽略這些值，並使用學習者的預設值。

如果您選取 [ 參數範圍 ] 選項，並針對任何參數輸入單一值，即使您的其他參數在值範圍中變更，您指定的單一值也會在整個掃掠中使用。
提交管線。

結果

完成定型之後：

若要儲存定型模型的快照集，請選取定型元件，然後在右側面板中切換至 [輸出 ] 索引卷標。按兩下圖示 [註冊模型]。您可以在元件樹狀結構中找到已儲存的模型作為元件。

下一步

請參閱 Azure 機器學習可用的元件集。

共用方式為

判定樹系回歸元件

運作方式

如何設定判定樹系回歸模型

結果

下一步

意見反應

其他資源