建立多類別分類模型

已完成

您也可以建立 多類別 分類模型,其中有兩個以上的可能類別。 例如:保健診所可能會擴展糖尿病模型,以將患者分類為:

  • 非糖尿病
  • 第 1 型糖尿病
  • 第 2 型糖尿病

個別類別機率值總計仍為 1 (在這三個類別中只有其中一種符合患者實際情況),而模型將會預測出機率最高的類別。

使用多類別分類模型

多類別分類可以視為多個二元分類器的組合。 有兩種方式可以解決問題:

  • 一對其他 (OVR),會為每個可能的類別值建立分類器,當預測結果是該類別時,視為正向結果;若預測為其他任何類別,則視為負向結果。 例如,四個可能的形狀類別 (方形、圓形、三角形、六邊形) 的分類問題需要四個可預測的分類器:
    • 是否為方形
    • 是否為圓形
    • 是否為三角形
    • 是否為六邊形
  • 一對一 (OVO),其中會針對每個可能的類別配對建立分類器。 四個形狀類別的分類問題需要下列二元分類器:
    • 方形或圓形
    • 方形或三角形
    • 方形或六邊形
    • 圓形或三角形
    • 圓形或六邊形
    • 三角形或六邊形

在這兩種方法中,整體模型必須考量所有這些預測,以判斷項目屬於哪個單一類別。

幸運的是,在大部分的機器學習架構 (包括 Scikit-Learn 學習) 中,實作多類別分類模型的方式不會比二元分類更加複雜太多,且在大多數情況下,用於二元分類的估算器會藉由抽象化 OVR 演算法、OVO 演算法或允許選擇其中一種,來隱含支援多類別分類。