Vyhodnocení klasifikačních modelů

4 min

Přesnost trénování klasifikačního modelu je mnohem méně důležitá než to, jak dobře bude tento model fungovat při zadání nových, neviditelných dat. Nakonec vytrénujeme modely tak, aby se mohly používat na nových datech, která najdeme v reálném světě. Jakmile tedy natrénujeme klasifikační model, vyhodnotíme, jak funguje u sady nových, nezoznaných dat.

V předchozích lekcích jsme vytvořili model, který by předpověděl, jestli pacient měl cukrovku nebo ne na základě hladiny glukózy v krvi. Když nyní použijeme některá data, která nebyla součástí trénovací sady, dostaneme následující předpovědi.

x	y	ŷ
83	0	0
119	1	1
104	1	0
105	0	1
86	0	0
109	1	1

Vzpomeňte si, že x odkazuje na hladinu glukózy v krvi, y odkazuje na to, zda jsou skutečně diabetici, a ŷ odkazuje na predikci modelu, zda jsou diabetici nebo ne.

Jen výpočet, kolik předpovědí bylo správné, je někdy zavádějící nebo příliš zjednodušené, abychom pochopili druhy chyb, které provede v reálném světě. Abychom získali podrobnější informace, můžeme výsledky tabulovat ve struktuře označované jako konfuzní matice, například takto:

Konfuzní matice zobrazující 2 skutečně negativní hodnoty, 2 skutečně pozitivní hodnoty, 1 falešně negativní hodnotu a 1 falešně pozitivní hodnotu.

Konfuzní matice zobrazuje celkový počet případů, kdy:

Model predikoval hodnotu 0 a skutečný popisek je 0 (pravdivě záporné hodnoty, vlevo nahoře)
Model predikoval 1 a skutečný popisek je 1 (pravé pozitivní, vpravo dole)
Model predikoval hodnotu 0 a skutečný popisek je 1 (falešně negativní hodnoty, vlevo dole)
Model předpověděl 1 a skutečný štítek je 0 (falešný pozitivní výsledek, vpravo nahoře)

Buňky v konfuzní matici jsou často stínovány tak, aby vyšší hodnoty měly hlubší stín. To usnadňuje zobrazení silného diagonálního trendu z levého horního do pravého dolního rohu a zvýraznění buněk, kde jsou predikovaná hodnota a skutečná hodnota stejné.

Z těchto základních hodnot můžete vypočítat rozsah dalších metrik, které vám pomůžou vyhodnotit výkon modelu. Příklad:

Přesnost: (TP+TN)/(TP+TN+FP+FN) – všechny předpovědi, kolik jich bylo správné?
Vzpomeňte si: TP/(TP+FN) – ve všech případech, které jsou pozitivní, kolik model identifikoval?
Přesnost: TP/(TP+FP) – ze všech případů, které model predikoval jako pozitivní, kolik z nich je skutečně pozitivních?

Váš názor

Byla tato stránka užitečná?