多元促進式決策樹

發行項
06/01/2023

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件來建立以促進式決策樹演算法為基礎的機器學習模型。

促進式決策樹是一種整體學習方法，其中，第二個樹狀更正第一個樹狀的錯誤，第三個樹狀更正第一個和第二個樹狀的錯誤，依此類推。預測是以整體樹狀為基礎。

如何設定

此元件會建立未定型的分類模型。因為分類是監督式學習方法，所以您需要「已標記資料集」，其中包含所有資料列的標籤資料行和值。

您可以使用定型模型來定型這種類型的模型。

將多類別促進式決策樹元件新增至您的管線。
設定 [建立定型模式] 選項來指定要如何定型模型。
- 單一參數：如果您知道要如何設定模型，您可以提供一組特定值做為引數。
- 參數範圍：如果您不確定最佳參數，且想要執行參數掃掠，請選取此選項。選取要反覆運算的值範圍，而調整模型超參數會反覆運算您提供的所有可能設定的組合，以判斷可產生最佳結果的超參數。
每個樹狀的分葉數上限：限制可在任何樹狀中建立的終端節點 (分葉) 數目上限。

增加此值，您可能會增加樹狀的大小，並實現更高的精確度，風險是過度學習和更長的定型時間。
[每個分葉節點的樣本數下限] 指出在樹狀中建立任何終端節點 (分葉) 所需的案例數目。

藉由增加此值，您會增加建立新規則的臨界值。例如，若預設值是 1，即使單一案例可能會造成新規則的建立。如果您將此值增加為 5，則定型資料必須至少包含五個符合相同條件的案例。
學習速率定義學習時的步調大小。輸入 0 到 1 之間的數字。

學習速率會決定學習模組會合到最佳解決方案的快慢。如果步調太大，您可能會超過最佳解決方案。如果步驟太小，則定型會較久才收斂到最佳解決方案。
建構的樹狀數目指出要在整體中建立的決策樹總數。藉由建立多個決策樹，您或許能夠有較佳的涵蓋範圍，但是定型時間會拉長。
[亂數種子] 會選擇性地設定非負整數，作為隨機種子值。指定種子可確保每次以相同資料和參數執行都能重現。

隨機種子預設會設定為 42。使用不同隨機種子的連續執行可能會有不同的結果。
定型模型：
- 如果您將 [建立定型模式] 設定為 [單一參數]，請連接已標記的資料集和定型模型元件。
- 如果您將 [建立定型模式] 設定為 [參數範圍]，請連接已標記的資料集，並使用調整模型超參數來定型模型。
注意

如果您將參數範圍傳遞給定型模型，則系統只會使用單一參數清單中的預設值。

如果您將單一組參數值傳遞至調整模型超參數元件，當其預期每個參數有一組設定時，則會忽略這些值，並對學習模組使用預設值。

如果您選取 [參數範圍] 選項，並對任何參數輸入單一值，則在整個掃掠期間都會使用您所指定的該單一值，即使其他參數在某個範圍的值之間變更亦然。

後續步驟

請參閱 Azure Machine Learning 可用的元件集。

多元促進式決策樹

如何設定

後續步驟

其他資源