Többosztályos besorolási modellek létrehozása
Többosztályos besorolási modelleket is létrehozhat, amelyekben több osztály is lehetséges. Az egészségügyi klinika például kibővítheti a diabéteszes modellt, hogy a betegeket a következőként sorolja be:
- Nem diabéteszes
- 1-es típusú diabéteszes
- 2-es típusú diabéteszes
Az egyes osztály valószínűségi értékei továbbra is összesen 1-et adnak hozzá, mivel a beteg egyértelműen csak a három osztály egyikében van, és a legvalószínűbb osztályt a modell előrejelzi.
Többosztályos besorolási modellek használata
A többosztályos besorolás több bináris osztályozó kombinációjának tekinthető. A probléma kétféleképpen közelíthető meg:
-
One vs Rest (OVR), amelyben egy osztályozó jön létre minden lehetséges osztályértékhez. Az esetek, amikor az előrejelzés ehhez az osztályhoz tartozik, pozitív eredménnyel zárulnak, míg az előrejelzés bármely más osztályra negatívként minősül. Egy négy lehetséges alakzatosztály (négyzet, kör, háromszög, hatszög) besorolási problémájához például négy osztályozó szükséges, amelyek előrejelzik a következőt:
- négyzet vagy sem
- kör vagy sem
- háromszög vagy sem
- hatszög vagy sem
-
Egy vagy egy (OVO), amelyben létrejön egy osztályozó minden lehetséges osztálypárhoz. A négy alakzatosztály besorolási problémájához a következő bináris osztályozók szükségesek:
- négyzet vagy kör
- négyzet vagy háromszög
- négyzet vagy hatszög
- kör vagy háromszög
- kör vagy hatszög
- háromszög vagy hatszög
Mindkét megközelítésben a teljes modellnek figyelembe kell vennie az összes előrejelzést annak meghatározásához, hogy az elem melyik kategóriához tartozik.
Szerencsére a legtöbb gépi tanulási keretrendszerben, például a Scikit-Learnben a többosztályos besorolási modell implementálása nem lényegesen összetettebb, mint a bináris besorolás – és a legtöbb esetben a bináris besoroláshoz használt becslők implicit módon támogatják a többosztályos besorolást egy OVR-algoritmus, egy OVO-algoritmus absztrakciója vagy a választható lehetőségek választásával.