Vyhodnocení výkonu modelu v nástroji Machine Learning Studio (Classic)

PLATÍ PRO: Platí pro. Machine Learning Studio (Klasické) Nevztahuje se na. Azure Machine Learning

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Do tohoto data doporučujeme přejít na Azure Machine Learning .

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Přečtěte si informace o přesunu projektů strojového učení ze sady ML Studio (classic) do služby Azure Machine Learning.
Další informace o službě Azure Machine Learning

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

V tomto článku se dozvíte o metrikách, které můžete použít k monitorování výkonu modelu v nástroji Machine Learning Studio (classic). Vyhodnocení výkonu modelu je jednou ze základních fází procesu datových věd. Označuje, jak úspěšné bodování (předpovědi) datové sady proběhlo vytrénovaným modelem. Machine Learning Studio (classic) podporuje vyhodnocování modelů prostřednictvím dvou hlavních modulů strojového učení:

Tyto moduly umožňují zjistit, jak model funguje z hlediska řady metrik, které se běžně používají ve strojovém učení a statistikách.

Hodnocení modelů by mělo být zvažováno společně s následujícími:

Jsou uvedeny tři běžné scénáře učení pod dohledem:

regrese do dřívějšího stavu
binární klasifikace
vícetřídová klasifikace

Vyhodnocení vs. Křížové ověření

Vyhodnocení a křížové ověřování jsou standardní způsoby měření výkonu modelu. Oba generují metriky vyhodnocení, které můžete zkontrolovat nebo porovnat s metrikami jiných modelů.

Vyhodnocení modelu očekává jako vstup vyhodnocenou datovou sadu (nebo dva v případě, že byste chtěli porovnat výkon dvou různých modelů). Proto potřebujete vytrénovat model pomocí modulu Trénování modelu a před vyhodnocením výsledků provést předpovědi u některé datové sady pomocí modulu Určení skóre modelu . Vyhodnocení vychází z skóre popisků a pravděpodobností spolu s skutečnými popisky, z nichž všechny jsou výstupem modulu Score Model .

Případně můžete použít křížové ověření k automatickému provádění několika operací trénování-hodnocení (10 dílčích) na různých podmnožinách vstupních dat. Vstupní data jsou rozdělena na 10 částí, kde je jedna vyhrazena pro testování a druhá 9 pro trénování. Tento proces se opakuje 10krát a metriky vyhodnocení se zprůměrují. To pomáhá při určování, jak dobře by model generalizoval nové datové sady. Modul Cross-Validate Model přebírá netrénovaný model a některé označené datové sady a výstupem jsou výsledky vyhodnocení každého z 10 složených záhybů kromě průměrných výsledků.

V následujících částech vytvoříme jednoduché regrese a klasifikační modely a vyhodnotíme jejich výkon pomocí modulů Vyhodnotit model i Model křížového ověření .

Vyhodnocení regresního modelu

Předpokládejme, že chceme předpovědět cenu auta pomocí funkcí, jako jsou rozměry, koňská síla, specifikace motoru atd. Jedná se o typický problém regrese, kdy cílová proměnná (cena) je souvislá číselná hodnota. Můžeme přizpůsobit model lineární regrese, který s ohledem na hodnoty vlastností určitého auta dokáže předpovědět cenu tohoto auta. Tento regresní model lze použít k určení skóre stejné datové sady, na které jsme natrénovali. Jakmile budeme mít predikované ceny aut, můžeme výkon modelu vyhodnotit tak, že se podíváme na to, kolik predikcí se v průměru odchyluje od skutečných cen. K ilustraci použijeme datovou sadu Automobile Price Data (Raw) dostupnou v části Uložené datové sady v nástroji Machine Learning Studio (classic).

Vytvoření experimentu

Do pracovního prostoru v nástroji Machine Learning Studio (classic) přidejte následující moduly:

Připojte porty, jak je znázorněno na obrázku 1, a nastavte sloupec Label modulu Trénovat Model na cenu.

Vyhodnocení regresního modelu

Obrázek č. 1. Vyhodnocení regresního modelu

Kontrola výsledků vyhodnocení

Po spuštění experimentu můžete kliknout na výstupní port modulu Vyhodnotit model a vybrat Vizualizovat a zobrazit výsledky vyhodnocení. Metriky vyhodnocení dostupné pro regresní modely jsou: střední absolutní chyba, absolutní chyba kořene, relativní absolutní chyba, relativní kvadratická chyba a koeficient určení.

Výraz "error" zde představuje rozdíl mezi predikovanou hodnotou a skutečnou hodnotou. Absolutní hodnota nebo druhou mocninu tohoto rozdílu se obvykle vypočítá za účelem zachycení celkové velikosti chyby ve všech instancích, protože rozdíl mezi predikovanou a skutečnou hodnotou může být v některých případech záporný. Metriky chyb měří prediktivní výkon regresního modelu z hlediska střední odchylky jejích předpovědí od skutečných hodnot. Nižší chybové hodnoty znamenají, že model je přesnější při vytváření předpovědí. Celková metrika chyby nuly znamená, že model dokonale odpovídá datům.

Koeficient určení, který se také označuje jako R squared, je také standardní způsob měření, jak dobře model vyhovuje datům. Dá se interpretovat jako poměr variant, který model vysvětluje. Vyšší podíl je v tomto případě lepší, kde 1 označuje perfektní fit.

Metriky vyhodnocení lineární regrese

Obrázek č. 2. Metriky vyhodnocení lineární regrese

Použití křížového ověřování

Jak už bylo zmíněno dříve, můžete provádět opakované trénování, bodování a hodnocení automaticky pomocí modulu Křížové ověření modelu . V tomto případě stačí datová sada, nenatrénovaný model a modul křížového ověření ( viz obrázek níže). Ve vlastnostech modulu Cross-Validate Model je potřeba nastavit sloupec popisku na cenu.

Křížové ověřování regresního modelu

Obrázek č. 3. Křížové ověřování regresního modelu

Po spuštění experimentu můžete výsledky vyhodnocení zkontrolovat kliknutím na správný výstupní port modulu Křížové ověření modelu . Zobrazí se podrobné zobrazení metrik pro každou iteraci (složené) a průměrné výsledky jednotlivých metrik (obrázek 4).

Výsledky křížového ověření regresního modelu

Obrázek č. 4. Výsledky křížového ověření regresního modelu

Vyhodnocení binárního klasifikačního modelu

Ve scénáři binární klasifikace má cílová proměnná pouze dva možné výsledky, například: {0, 1} nebo {false, true}, {negative, positive}. Předpokládejme, že máte datovou sadu zaměstnanců pro dospělé s některými demografickými proměnnými a proměnnými zaměstnání a že jste požádáni o predikci úrovně příjmů, binární proměnnou s hodnotami {"<=50 K", ">50 K"}. Jinými slovy, záporná třída představuje zaměstnance, kteří mají příjem menší nebo roven 50 tisícům ročně, a kladná třída představuje všechny ostatní zaměstnance. Stejně jako ve scénáři regrese bychom vytrénovali model, skórovali některá data a vyhodnotili výsledky. Hlavním rozdílem je výběr metrik, které Machine Learning Studio (classic) vypočítá a výstupy. K ilustraci scénáře predikce úrovně příjmu použijeme datovou sadu Adult k vytvoření experimentu ve Studio (classic) a vyhodnocení výkonu logistického regresního modelu pro dvě třídy, běžně používaného binárního klasifikátoru.