Vytvoření vícetřídových klasifikačních modelů

Dokončeno

Je také možné vytvořit vícetřídové klasifikační modely, ve kterých je více než dvě možné třídy. Například zdravotní klinika může rozšířit model cukrovky, aby klasifikovala pacienty jako:

  • Non-diabetic
  • Diabetik typu 1
  • Diabetik typu 2

Hodnoty pravděpodobnosti jednotlivých tříd by stále sečtily celkem 1, protože pacient je rozhodně v jedné ze tří tříd a nejpravděpodobnější třída by byla předpovězena modelem.

Použití klasifikačních modelů s více třídami

Vícetřídní klasifikaci lze považovat za kombinaci více binárních klasifikátorů. K problému přistupujete dvěma způsoby:

  • Jeden vs Rest (OVR), ve kterém je klasifikátor vytvořen pro každou možnou hodnotu třídy, s pozitivním výsledkem pro případy, kdy je predikce tato třída, a negativní předpovědi pro případy, kdy je předpověď jakoukoli jinou třídou. Například klasifikační problém se čtyřmi možnými třídami obrazců (čtverec, kruh, trojúhelník, šestiúhelník) by vyžadoval čtyři klasifikátory, které predikovaly:
    • čtverec nebo ne
    • kruh nebo ne
    • trojúhelník nebo ne
    • šestiúhelník nebo ne
  • Jeden vs One (OVO), ve kterém je vytvořen klasifikátor pro každou možnou dvojici tříd. Klasifikační problém se čtyřmi třídami obrazců by vyžadoval následující binární klasifikátory:
    • čtvercový nebo kruh
    • čtverec nebo trojúhelník
    • čtverec nebo šestiúhelník
    • kruh nebo trojúhelník
    • kruh nebo šestiúhelník
    • trojúhelník nebo šestiúhelník

V obou přístupech musí celkový model vzít v úvahu všechny tyto předpovědi, aby bylo možné určit, do které kategorie položka patří.

Ve většině architektur strojového učení, včetně Scikit-Learn, implementace klasifikačního modelu s více třídami není naštěstí složitější než binární klasifikace – a ve většině případů odhadátory používané pro binární klasifikaci implicitně podporují vícetřídovou klasifikaci abstrakcí algoritmu OVR, algoritmem OVO nebo povolením výběru.