Vytvoření vícetřídových klasifikačních modelů

Dokončeno

Je také možné vytvořit vícetřídové klasifikační modely, ve kterých je více než dvě možné třídy. Například zdravotní klinika může rozšířit model cukrovky, aby klasifikovala pacienty jako:

  • Nediabetický
  • Diabetik typu 1
  • Diabetik typu 2

Hodnoty pravděpodobnosti jednotlivých tříd by stále sečtily celkem 1, protože pacient je rozhodně v jedné ze tří tříd a nejpravděpodobnější třída by byla předpovězena modelem.

Použití klasifikačních modelů s více třídami

Vícetřídní klasifikaci lze považovat za kombinaci více binárních klasifikátorů. K problému přistupujete dvěma způsoby:

  • Jeden vs Zbytek (OVR), při kterém se pro každou možnou hodnotu třídy vytvoří klasifikátor, který dává pozitivní výsledek pro případy, kdy je předpovězená právě tato třída, a negativní výsledky ve všech ostatních případech. Například klasifikační problém se čtyřmi možnými třídami obrazců (čtverec, kruh, trojúhelník, šestiúhelník) by vyžadoval čtyři klasifikátory, které predikovaly:
    • čtverec nebo ne
    • kruh nebo ne
    • trojúhelník nebo ne
    • šestiúhelník nebo ne
  • Jedna proti jedné (OVO), ve kterém je vytvořen klasifikátor pro každou možnou dvojici tříd. Klasifikační problém se čtyřmi třídami obrazců by vyžadoval následující binární klasifikátory:
    • čtvercový nebo kruh
    • čtverec nebo trojúhelník
    • čtverec nebo šestiúhelník
    • kruh nebo trojúhelník
    • kruh nebo šestiúhelník
    • trojúhelník nebo šestiúhelník

V obou přístupech musí celkový model vzít v úvahu všechny tyto předpovědi, aby bylo možné určit, do které kategorie položka patří.

Ve většině architektur strojového učení, včetně Scikit-Learn, implementace klasifikačního modelu s více třídami není naštěstí složitější než binární klasifikace – a ve většině případů odhadátory používané pro binární klasifikaci implicitně podporují vícetřídovou klasifikaci abstrakcí algoritmu OVR, algoritmem OVO nebo povolením výběru.