Opret klassificeringsmodeller med flere klassificeringer
Det er også muligt at oprette klassificeringsmodeller med flere klasser, hvor der er mere end to mulige klasser. Sundhedsklinikken kan f.eks. udvide diabetesmodellen for at klassificere patienter som:
- Ikke-diabetiker
- Type-1 diabetiker
- Type-2 diabetiker
De individuelle klassesandsynlighedsværdier vil stadig tilføje op til i alt 1, da patienten absolut kun er i én af de tre klasser, og den mest sandsynlige klasse forudsiges af modellen.
Brug af flerklasseklassificeringsmodeller
Multiclass-klassificering kan opfattes som en kombination af flere binære klassificeringer. Du kan løse problemet på to måder:
-
One vs Rest (OVR), hvor der oprettes en klassificering for hver mulig klasseværdi med et positivt resultat for de tilfælde, hvor forudsigelsen er denne klasse, og negative forudsigelser for de tilfælde, hvor forudsigelsen er en anden klasse. Et klassificeringsproblem med fire mulige figurklasser (kvadrat, cirkel, trekant, sekskant) kræver f.eks. fire klassificeringer, der forudsiger:
- firkantet eller ej
- cirkel eller ej
- trekant eller ej
- sekskant eller ej
-
One vs. One (OVO), hvor der oprettes en klassificering for hvert mulige klassepar. Klassificeringsproblemet med fire figurklasser kræver følgende binære klassificeringer:
- kvadrat eller cirkel
- firkantet eller trekant
- firkantet eller sekskantet
- cirkel eller trekant
- cirkel eller sekskant
- trekant eller sekskant
I begge tilgange skal den overordnede model tage højde for alle disse forudsigelser for at bestemme, hvilken enkelt kategori elementet tilhører.
Heldigvis er implementering af en klassificeringsmodel med flere klassificeringer i de fleste rammer for maskinel indlæring, herunder Scikit-Learn, ikke væsentligt mere kompleks end binær klassificering – og i de fleste tilfælde understøtter de skønsmænd, der bruges til binær klassificering, implicit multiclass-klassificering ved at udtrække en OVR-algoritme, en OVO-algoritme eller ved at tillade et valg af en af dem.