Interpretace výsledků modelu v nástroji Machine Learning Studio (classic)

Článek
11/29/2017

PLATÍ PRO: Toto je značka zaškrtnutí, což znamená, že tento článek se týká nástroje Machine Learning Studio (classic). Machine Learning Studio (Classic) Toto je X, což znamená, že tento článek se nevztahuje na Azure Machine Learning. Azure Machine Learning

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Přečtěte si informace o přesunu projektů strojového učení ze sady ML Studio (classic) do služby Azure Machine Learning.
Další informace o službě Azure Machine Learning

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Toto téma vysvětluje, jak vizualizovat a interpretovat výsledky předpovědi v nástroji Machine Learning Studio (classic). Po vytrénování modelu a provedení předpovědí nad ním ("skóre modelu"), musíte pochopit a interpretovat výsledek předpovědi.

V nástroji Machine Learning Studio (classic) existují čtyři hlavní druhy modelů strojového učení:

Klasifikace
Clustering
Regrese
Doporučené systémy

Moduly používané pro predikci nad těmito modely jsou:

Modul Určení skóre modelu pro klasifikaci a regresi
Přiřazení k modulu Clusters pro clustering
Doporučení matchboxu pro systémy doporučení

Zjistěte, jak zvolit parametry pro optimalizaci algoritmů v nástroji ML Studio (classic).

Pokud chcete zjistit, jak vyhodnotit modely, přečtěte si, jak vyhodnotit výkon modelu.

Pokud s ML Studio (classic) začínáte, přečtěte si, jak vytvořit jednoduchý experiment.

Klasifikace

Existují dvě podkategorie problémů klasifikace:

Problémy pouze se dvěma třídami (dvoutřídní nebo binární klasifikace)
Problémy s více než dvěma třídami (klasifikace s více třídami)

Machine Learning Studio (classic) má různé moduly pro každou z těchto typů klasifikace, ale metody interpretace výsledků predikce jsou podobné.

Dvoutřídní klasifikace

Příklad experimentu

Příkladem problému klasifikace se dvěma třídami je klasifikace květů duhovky. Úkolem je klasifikovat iris květiny na základě jejich vlastností. Datová sada Iris poskytovaná v nástroji Machine Learning Studio (classic) je podmnožinou oblíbené datové sady Iris obsahující instance pouze dvou druhů květin (třídy 0 a 1). Pro každou květinu jsou čtyři funkce (délka sepalu, šířka sepalu, délka okvětního lístku a okvětní šířka).

Snímek obrazovky experimentu iris

Obrázek č. 1. Experiment se dvěma třídami klasifikace Iris

K vyřešení tohoto problému došlo k experimentu, jak je znázorněno na obrázku 1. Model rozhodovacího stromu se dvěma třídami byl natrénován a vyhodnocen. Teď můžete vizualizovat výsledky předpovědi z modulu Určení skóre modelu kliknutím na výstupní port modulu Určení skóre modelu a následným kliknutím na Vizualizovat.

Modul určení skóre modelu

Tím se zobrazí výsledky vyhodnocování, jak je znázorněno na obrázku 2.

Výsledky experimentu klasifikace iris se dvěma třídami

Obrázek č. 2. Vizualizace výsledku modelu skóre ve dvou třídách

Interpretace výsledků

V tabulce výsledků je šest sloupců. Levé čtyři sloupce jsou čtyři funkce. Správné dva sloupce: Scored Labels a Scored Probabilities, jsou výsledky předpovědi. Sloupec Scored Probabilities (Skóre pravděpodobností) zobrazuje pravděpodobnost, že květina patří do kladné třídy (třída 1). Například první číslo ve sloupci (0,028571) znamená, že existuje pravděpodobnost 0,028571, že první květina patří do třídy 1. Sloupec Scored Labels (Popisky skóre) zobrazuje predikovanou třídu pro každou květinu. To je založeno na sloupci Scored Probabilities (Pravděpodobnosti skóre). Pokud je vyhodnocená pravděpodobnost květiny větší než 0,5, předpovídá se jako třída 1. Jinak se predikuje jako třída 0.

Publikování webové služby

Po pochopení a posouzení výsledků predikce je možné experiment publikovat jako webovou službu, abyste ji mohli nasadit v různých aplikacích a volat ji k získání predikcí tříd na jakékoli nové kosatce iris. Informace o tom, jak změnit trénovací experiment na hodnoticí experiment a publikovat ho jako webovou službu, najdete v kurzu 3: Nasazení modelu úvěrového rizika. Tento postup poskytuje hodnoticí experiment, jak je znázorněno na obrázku 3.

Snímek obrazovky experimentu s bodováním

Obrázek č. 3. Vyhodnocení experimentu s problémem klasifikace iris ve dvou třídách

Teď potřebujete nastavit vstup a výstup webové služby. Vstup je správný vstupní port modelu skóre, což je vstup Iris flower. Volba výstupu závisí na tom, jestli vás zajímá predikovaná třída (popisek skóre), pravděpodobnost skóre nebo obojí. V tomto příkladu se předpokládá, že vás zajímá obojí. K výběru požadovaných výstupních sloupců použijte modul Vybrat sloupce v sadě dat. Klepněte na tlačítko Vybrat sloupce v sadě dat, klepněte na tlačítko Spustit selektor sloupců a vyberte Scored Labels and Scored Probabilities. Po nastavení výstupního portu Vybrat sloupce v sadě dat a jeho opětovném spuštění byste měli být připraveni publikovat experiment vyhodnocování jako webovou službu kliknutím na publikovat webovou službu. Konečný experiment vypadá jako obrázek 4.

Experiment klasifikace iris se dvěma třídami

Obrázek č. 4. Konečný experiment s bodováním problému klasifikace iris se dvěma třídami

Po spuštění webové služby a zadání některých hodnot funkcí testovací instance vrátí výsledek dvě čísla. První číslo je popisek skóre a druhý je vyhodnocená pravděpodobnost. Tato květina je předpovězena jako třída 1 s pravděpodobností 0,9655.

Test interpretující model skóre

Vyhodnocení výsledků testu

Obrázek č. 5. Výsledek webové služby dvojtřídní klasifikace iris

Klasifikace s více třídami

Příklad experimentu

V tomto experimentu provedete úlohu rozpoznávání písmen jako příklad klasifikace s více třídami. Klasifikátor se pokusí předpovědět určité písmeno %28class%29 na základě některých ručně psaných hodnot atributů extrahovaných z ručně psaných obrázků.

Příklad rozpoznávání dopisu

V trénovacích datech je 16 funkcí extrahovaných z rukou psaných obrázků dopisů. 26 písmen tvoří naše 26 tříd. Obrázek 6 ukazuje experiment, který bude trénovat klasifikační model s více třídami pro rozpoznávání písmen a predikovat na stejné sadě funkcí v testovací sadě dat.

Experiment klasifikace více tříd pro rozpoznávání dopisů

Obrázek č. 6. Experiment problému s klasifikací více tříd pro rozpoznávání dopisů

Vizualizace výsledků z modulu Určení skóre modelu kliknutím na výstupní port modulu Určení skóre modelu a následným kliknutím na Vizualizovat by se měl zobrazit obsah, jak je znázorněno na obrázku 7.

Určení skóre výsledků modelu

Obrázek 7. Vizualizace výsledků modelu skóre v klasifikaci s více třídami

Interpretace výsledků

Levé 16 sloupců představuje hodnoty funkcí testovací sady. Sloupce s názvy, jako jsou Scored Probabilities pro třídu XX, jsou stejné jako sloupec Scored Probabilities v dvou třídách. Ukazují pravděpodobnost, že odpovídající položka spadá do určité třídy. Například pro první položku existuje pravděpodobnost 0,003571, že se jedná o pravděpodobnost "A", 0,000451, že je to "B", a tak dále. Poslední sloupec (Scored Labels) je stejný jako Scored Labels v dvoutřídním případě. Vybere třídu s největší pravděpodobností skóre jako předpovězenou třídu odpovídající položky. Například pro první položku je popisek skóre "F", protože má největší pravděpodobnost, že se jedná o "F" (0,916995).

Publikování webové služby

Můžete také získat popisek skóre pro každou položku a pravděpodobnost skóre popisku. Základní logika spočívá v nalezení největší pravděpodobnosti ze všech vyhodnocených pravděpodobností. K tomu je potřeba použít modul Spustit skript jazyka R. Kód R se zobrazuje na obrázku 8 a výsledek experimentu je znázorněn na obrázku 9.

Příklad kódu jazyka R

Obrázek 8. Kód R pro extrakci popisků skóre a přidružených pravděpodobností popisků

Výsledek experimentu

Obrázek 9. Konečný experiment s bodováním problému s více třídami klasifikace typu letter-recognition

Po publikování a spuštění webové služby a zadání některých vstupních hodnot funkcí bude vrácený výsledek vypadat jako obrázek 10. Tento rukou psaný dopis s extrahovanými 16 funkcemi je předpovězen jako "T" s pravděpodobností 0,9715.

Test interpretující modul skóre

Výsledek testu

Obrázek 10. Výsledek vícetřídové klasifikace webové služby

Regrese

Regresní problémy se liší od problémů klasifikace. Při klasifikačním problému se pokoušíte předpovědět diskrétní třídy, například do které třídy patří kosatá květina. Jak ale vidíte v následujícím příkladu problému s regresí, snažíte se předpovědět souvislou proměnnou, například cenu auta.

Příklad experimentu

Jako příklad pro regresi použijte predikci cen automobilů. Snažíte se předpovědět cenu auta na základě jeho funkcí, včetně make, typu paliva, typu těla a hnacího kola. Experiment se zobrazí na obrázku 11.

Experiment regrese cen automobilů

Obrázek 11. Experiment s regresí cen automobilů

Vizualizace modulu Určení skóre modelu vypadá jako na obrázku 12.

Výsledky bodování pro problém predikce cen automobilů

Obrázek 12 Výsledek bodování pro problém predikce cen automobilů

Interpretace výsledků

Popisky skóre jsou výsledným sloupcem v tomto výsledku bodování. Čísla představují predikovanou cenu pro každé auto.

Publikování webové služby

Regresní experiment můžete publikovat do webové služby a volat ho pro predikci cen automobilů stejným způsobem jako v případě použití klasifikace ve dvou třídách.

Experiment bodování pro problém regrese cen automobilů

Obrázek 13 Vyhodnocení experimentu s regresí cen automobilů

Spuštění webové služby vypadá vrácený výsledek jako obrázek 14. Predikovaná cena tohoto auta je 15 085,52 Kč.

Test interpretující modul bodování

Výsledky hodnoticího modulu

Obrázek 14 Výsledek webové služby problému s regresí cen automobilů

Clustering

Příklad experimentu

Pojďme znovu použít sadu dat Iris k vytvoření experimentu clusteringu. Tady můžete vyfiltrovat popisky tříd v sadě dat, aby měly jenom funkce a bylo možné je použít pro clustering. V tomto případě použití duhovky zadejte počet clusterů, které mají být během trénovacího procesu dva, což znamená, že byste květiny seskupily do dvou tříd. Experiment se zobrazí na obrázku 15.

Experiment s clusteringem Iris

Obrázek 15 Experiment s clusteringem Iris

Clustering se liší od klasifikace v tom, že trénovací datová sada sama o sobě neobsahuje popisky základní pravdy. Clustering seskupí instance trénovacích datových sad do různých clusterů. Během procesu trénování model označí položky tím, že se naučí rozdíly mezi jejich funkcemi. Potom lze natrénovaný model použít k další klasifikaci budoucích položek. V rámci problému s clusteringem máme zájem o dvě části výsledku. První část označuje trénovací datovou sadu a druhá klasifikuje novou datovou sadu pomocí natrénovaného modelu.

První část výsledku lze vizualizovat kliknutím na levý výstupní port trénování modelu clusteringu a následným kliknutím na Vizualizovat. Vizualizace je znázorněna na obrázku 16.

Výsledek clusteringu

Obrázek 16 Vizualizace výsledku clusteringu pro trénovací sadu dat

Výsledek druhé části, seskupování nových položek s natrénovaným modelem clusteringu, je znázorněno na obrázku 17.

Vizualizace výsledku clusteringu

Obrázek 17 Vizualizace výsledku clusteringu v nové sadě dat

Interpretace výsledků

I když výsledky těchto dvou částí pocházejí z různých fází experimentu, vypadají stejně a interpretují se stejným způsobem. První čtyři sloupce jsou funkce. Posledním sloupcem Přiřazení je výsledek předpovědi. Položky přiřazené stejnému číslu se predikují tak, že jsou ve stejném clusteru, to znamená, že sdílejí podobnosti nějakým způsobem (tento experiment používá výchozí metriku vzdálenosti Euklidovské vzdálenosti). Vzhledem k tomu, že jste zadali počet clusterů, které mají být 2, jsou položky v přiřazení označeny buď 0, nebo 1.

Publikování webové služby

Experiment clusteringu můžete publikovat do webové služby a volat ho pro predikce clusteringu stejným způsobem jako v případě použití klasifikace ve dvou třídách.

Experiment bodování pro problém s clusteringem duhovky

Obrázek 18 Vyhodnocení experimentu s problémem clusteringu duhovky

Po spuštění webové služby bude vrácený výsledek vypadat jako obrázek 19. Tato květina je předpovězena, že je v clusteru 0.

Modul vyhodnocení interpretace testů

Výsledek hodnoticího modulu

Obrázek 19 Výsledek webové služby dvojtřídní klasifikace iris

Doporučovací systém

Příklad experimentu

V případě doporučených systémů můžete jako příklad použít problém s doporučením restaurace: můžete zákazníkům doporučit restaurace na základě historie jejich hodnocení. Vstupní data se skládají ze tří částí:

Hodnocení restaurací od zákazníků
Data o funkcích zákazníků
Funkční data restaurace

S modulem Train Matchbox Recommender v nástroji Machine Learning Studio (classic) můžeme udělat několik věcí:

Predikce hodnocení pro daného uživatele a položku
Doporučte položky danému uživateli.
Vyhledání uživatelů souvisejících s daným uživatelem
Vyhledání položek souvisejících s danou položkou

Můžete si vybrat, co chcete udělat, výběrem ze čtyř možností v nabídce typu predikce Doporučovat. Tady si můžete projít všechny čtyři scénáře.

Doporučeného pro Matchbox

Typický experiment nástroje Machine Learning Studio (klasický) pro doporučovací systém vypadá jako obrázek 20. Informace o tom, jak tyto moduly doporučovacího systému používat, najdete v tématu Train matchbox recommender and Score matchbox recommender.

Experiment doporučeného systému

Obrázek 20 Experiment doporučeného systému

Interpretace výsledků

Predikce hodnocení pro daného uživatele a položku

Výběrem možnosti Predikce hodnocení v části Druh predikce doporučovacího nástroje žádáte doporučovací systém, aby předpověděl hodnocení pro daného uživatele a položku. Vizualizace výstupu doporučení Score Matchbox vypadá jako obrázek 21.

Skóre výsledku doporučovacího systému – předpověď hodnocení

Obrázek 21 Vizualizace výsledku skóre doporučeného systému – předpověď hodnocení

První dva sloupce jsou páry položek uživatele poskytnuté vstupními daty. Třetí sloupec je predikované hodnocení uživatele pro určitou položku. Například v prvním řádku se u zákazníka U1048 predikuje hodnocení restaurace 135026 jako 2.

Doporučte položky danému uživateli.

Výběrem doporučení položky v části Druh predikce doporučujícího uživatele žádáte doporučovací systém, aby doporučoval položky danému uživateli. Posledním parametrem, který chcete zvolit v tomto scénáři, je doporučený výběr položky. Možnost Z hodnocených položek (pro vyhodnocení modelu) je primárně určená pro vyhodnocení modelu během procesu trénování. Pro tuto fázi předpovědi zvolíme Ze všech položek. Vizualizace výstupu doporučovacího modulu Score Matchbox vypadá jako obrázek 22.

Výsledek skóre doporučeného systému – doporučení k položce

Obrázek 22 Vizualizace výsledku skóre doporučeného systému – doporučení

První ze šesti sloupců představuje daná ID uživatelů, která doporučí položky, jak jsou poskytována vstupními daty. Ostatních pět sloupců představuje položky doporučené uživateli v sestupném pořadí relevance. Například v prvním řádku je doporučená restaurace pro zákazníka U1048 134986 následovaná 135018, 134975, 135021 a 132862.

Vyhledání uživatelů souvisejících s daným uživatelem

Výběrem možnosti Související uživatelé v části Druh predikce Doporučeného uživatele žádáte doporučovací systém, aby našel související uživatele s daným uživatelem. Související uživatelé jsou uživatelé, kteří mají podobné preference. Posledním parametrem, který chcete zvolit v tomto scénáři, je Výběr souvisejícího uživatele. Možnost Od uživatelů s hodnocením (pro vyhodnocení modelu) je primárně určená pro vyhodnocení modelu během procesu trénování. Pro tuto fázi predikce zvolte možnost Ze všech uživatelů . Vizualizace výstupu doporučovacího modulu Score Matchbox vypadá jako obrázek 23.

Výsledek skóre doporučeného systému – související uživatelé

Obrázek 23 Vizualizace výsledků skóre doporučovat uživatele související se systémem

První ze šesti sloupců zobrazuje daná ID uživatelů potřebná k vyhledání souvisejících uživatelů, jak jsou poskytována vstupními daty. Ostatní pět sloupců ukládají predikované související uživatele uživatele v sestupném pořadí podle relevance. Například v prvním řádku je nejrelevavantnější zákazník pro zákazníka U1048 U1051, následovaný U1066, U1044, U1017 a U1072.

Vyhledání položek souvisejících s danou položkou

Výběrem možnosti Související položky v části Druh predikce doporučujícího se žádáte, aby systém doporučovačů našel související položky s danou položkou. Související položky jsou položky, které se s největší pravděpodobností líbí stejnému uživateli. Posledním parametrem, který chcete zvolit v tomto scénáři, je výběr související položky. Možnost Z hodnocených položek (pro vyhodnocení modelu) je primárně určená pro vyhodnocení modelu během procesu trénování. Pro tuto fázi predikce zvolíme Možnost Ze všech položek . Vizualizace výstupu doporučovacího modulu Score Matchbox vypadá jako obrázek 24.

Výsledek skóre doporučeného systému – související položky

Obrázek 24 Vizualizace výsledků skóre doporučených položek souvisejících se systémem

První ze šesti sloupců představuje daná ID položek potřebná k vyhledání souvisejících položek, jak jsou poskytována vstupními daty. Ostatních pět sloupců ukládá predikované související položky položky v sestupném pořadí z hlediska relevance. Například v prvním řádku je nejrelevavantnější položka pro položku 135026 135074, za kterou následuje 135035, 132875, 135055 a 134992.

Publikování webové služby

Proces publikování těchto experimentů jako webových služeb pro získání předpovědí je podobný pro každý ze čtyř scénářů. Tady jako příklad vezmeme druhý scénář (doporučíme položky danému uživateli). Můžete postupovat stejným postupem s ostatními třemi.

Uložení natrénovaného doporučovacího systému jako vytrénovaného modelu a filtrování vstupních dat do jednoho sloupce ID uživatele podle potřeby můžete experiment připojit jako na obrázku 25 a publikovat ho jako webovou službu.

Vyhodnocení experimentu s doporučením restaurace

Obrázek 25 Vyhodnocení experimentu s doporučením restaurace

Spuštění webové služby vypadá vrácený výsledek jako obrázek 26. Pět doporučených restaurací pro uživatele U1048 je 134986, 135018, 134975, 135021 a 132862.

Ukázka doporučovací systémové služby

Ukázkové výsledky experimentu

Obrázek 26 Výsledek webové služby problému s doporučením restaurace

Sdílet prostřednictvím

Interpretace výsledků modelu v nástroji Machine Learning Studio (classic)

Klasifikace

Dvoutřídní klasifikace

Klasifikace s více třídami

Regrese

Clustering

Doporučovací systém

Další materiály