Megosztás a következőn keresztül:


Modelleredmények értelmezése a Machine Learning Studióban (klasszikus)

ÉRVÉNYES:Ez egy pipa, ami azt jelenti, hogy ez a cikk a Machine Learning Studióra (klasszikus) vonatkozik. Machine Learning Studio (klasszikus) Ez egy X, ami azt jelenti, hogy ez a cikk nem vonatkozik az Azure Machine Learningre.Azure Machine Learning

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a témakör azt ismerteti, hogyan jeleníthet meg és értelmezhet előrejelzési eredményeket a Machine Learning Studióban (klasszikus). Miután betanított egy modellt, és előrejelzéseket készített rajta ("pontozott a modell"), meg kell értenie és értelmeznie kell az előrejelzés eredményét.

A Machine Learning Studióban (klasszikus) négy fő gépi tanulási modell létezik:

  • Osztályozás
  • Fürtözés
  • Regresszió
  • Ajánlórendszerek

Az előrejelzéshez használt modulok a következő modelleken alapulnak:

Megtudhatja, hogyan választhat paramétereket az algoritmusok optimalizálásához az ML Studióban (klasszikus).

A modellek kiértékelésének módjáról a modell teljesítményének kiértékelése című témakörben olvashat.

Ha most ismerkedik az ML Studio (klasszikus) alkalmazással, megtudhatja, hogyan hozhat létre egy egyszerű kísérletet.

Osztályozás

A besorolási problémáknak két alkategóriája van:

  • Csak két osztály (kétosztályos vagy bináris besorolás) problémái
  • Két osztálynál több osztály (többosztályos besorolás) problémái

A Machine Learning Studio (klasszikus) különböző modulokkal rendelkezik az ilyen típusú besorolások kezeléséhez, de az előrejelzési eredmények értelmezésének módszerei hasonlóak.

Kétosztályos besorolás

Példakísérlet

Egy kétosztályos besorolási problémára példa az íriszvirágok besorolása. A feladat az írisz virágainak besorolása a jellemzőik alapján. A Machine Learning Studióban (klasszikus) biztosított Írisz-adatkészlet a népszerű írisz adatkészlet egy része, amely csak két virágfaj példányait tartalmazza (0. és 1. osztály). Minden virághoz négy jellemző tartozik (a sepal hossza, a sepal szélessége, a szirom hossza és a sziromszélesség).

Az íriszkísérlet képernyőképe

1. ábra Írisz kétosztályos besorolási problémakísérlet

Kísérlet történt a probléma megoldására az 1. ábrán látható módon. A kétosztályos kiemelt döntési fa modell betanítása és pontozása megtörtént. Most már vizualizálhatja a Modell pontozása modul előrejelzési eredményeit a Modell pontozása modul kimeneti portjára kattintva, majd a Vizualizáció elemre kattintva.

Modellmodul pontozása

Ez a 2. ábrán látható módon jeleníti meg a pontozási eredményeket.

Az írisz kétosztályos besorolási kísérletének eredményei

2. ábra Pontszámmodell eredményeinek vizualizációja kétosztályos besorolással

Eredmény értelmezése

Az eredménytáblában hat oszlop található. A bal oldali négy oszlop a négy jellemző. A jobb oldali két oszlop, a Pontozott címkék és a Pontozott valószínűségek az előrejelzési eredmények. A Pontozott valószínűségek oszlopban látható annak a valószínűsége, hogy egy virág a pozitív osztályhoz tartozik (1. osztály). Az oszlop első száma (0,028571) például azt jelenti, hogy 0,028571 a valószínűsége annak, hogy az első virág az 1. osztályba tartozik. A Pontozott címkék oszlop az egyes virágokhoz tartozó előrejelzett osztályt jeleníti meg. Ez a Pontozott valószínűségek oszlopon alapul. Ha egy virág pontozott valószínűsége nagyobb, mint 0,5, akkor az 1. osztályként lesz előre jelezve. Ellenkező esetben a 0. osztály lesz előrejelzve.

Webszolgáltatás kiadványa

Az előrejelzési eredmények megértését és a megfelelő megítélést követően a kísérlet közzétehető webszolgáltatásként, így különböző alkalmazásokban is üzembe helyezheti, és meghívhatja, hogy osztály-előrejelzéseket szerezzen minden új íriszvirágon. Ha meg szeretné tudni, hogyan módosíthatja a betanítási kísérleteket pontozási kísérletté, és hogyan teheti közzé webszolgáltatásként, tekintse meg a 3. oktatóanyagot: Hitelkockázati modell üzembe helyezése. Ez az eljárás egy pontozási kísérletet biztosít a 3. ábrán látható módon.

Képernyőkép a pontozási kísérletről

3. ábra Az írisz kétosztályos besorolási problémakísérletének pontozása

Most be kell állítania a webszolgáltatás bemenetét és kimenetét. A bemenet a Score Model megfelelő bemeneti portja, amely az Írisz virágfunkciók bemenete. A kimenet kiválasztása attól függ, hogy érdekli-e az előrejelzett osztály (pontozott címke), a pontozott valószínűség vagy mindkettő. Ebben a példában feltételezzük, hogy mindkettő érdekli. A kívánt kimeneti oszlopok kiválasztásához használja az Adatkészlet oszlopainak kijelölése modult . Kattintson az Adathalmaz oszlopainak kijelölése, majd az Oszlopkijelölő indítása elemre, majd a Pontozott címkék és a Pontozott valószínűségek elemre. Miután beállította az Adatkészlet oszlopainak kijelölése kimeneti portját, és újra futtatta, készen kell állnia a pontozási kísérlet webszolgáltatásként való közzétételére a PUBLISH WEB SERVICE (WEBSZOLGÁLTATÁS KÖZZÉTÉTELE) gombra kattintva. Az utolsó kísérlet a 4. ábrához hasonlít.

Az írisz kétosztályos besorolási kísérlete

4. ábra Írisz kétosztályos besorolási probléma utolsó pontozási kísérlete

Miután futtatta a webszolgáltatást, és megadta egy tesztpéldány néhány funkcióértékét, az eredmény két számot ad vissza. Az első szám a pontozott címke, a második pedig a pontozott valószínűség. Ezt a virágot 0,9655-ös valószínűséggel az 1. osztályként jelzik előre.

Pontozási modell tesztelése

Pontozási teszteredmények

5. ábra Az írisz kétosztályos besorolásának webszolgáltatás-eredménye

Többosztályos besorolás

Példakísérlet

Ebben a kísérletben egy levélfelismerő feladatot hajt végre a többosztályos besorolás példájaként. Az osztályozó megkísérli előrejelezni a(z) %28class%29 betűt a kézzel írt képekből kinyert kézzel írt attribútumértékek alapján.

Példa levélfelismerésre

A betanítási adatokban 16 funkció található, amelyek kézzel írt levélképekből származnak. A 26 betű alkotja a 26 osztályt. A 6. ábrán egy kísérlet látható, amely egy többosztályos besorolási modellt tanít be a betűfelismeréshez, és előrejelzi a tesztadatkészlet ugyanazon funkciókészletét.

Betűfelismerési többosztályos besorolási kísérlet

6. ábra Betűfelismerési többosztályos besorolási problémakísérlet

A Modell pontozása modul eredményeinek vizualizációja a Modell pontozása modul kimeneti portjára kattintva, majd a Vizualizáció elemre kattintva a 7. ábrán látható tartalomnak kell megjelennie.

Modelleredmények pontozása

7. ábra Pontszámmodell eredményeinek vizualizációja többosztályos besorolásban

Eredmény értelmezése

A bal oldali 16 oszlop a tesztkészlet funkcióértékét jelöli. A "XX" osztály pontozott valószínűségeihez hasonló nevű oszlopok a kétosztályos eset Pontozott valószínűség oszlopához hasonlóak. Annak valószínűségét mutatják, hogy a megfelelő bejegyzés egy adott osztályba esik. Az első bejegyzésnél például 0,003571 annak a valószínűsége, hogy "A", 0,000451 valószínűsége annak, hogy "B" és így tovább. Az utolsó oszlop (pontozott címkék) megegyezik a kétosztályos eset pontozott címkéinek oszlopával. Kiválasztja azt az osztályt, amelynek legnagyobb pontozott valószínűsége van a megfelelő bejegyzés előrejelzett osztályaként. Az első bejegyzés esetében például a pontozott címke "F", mivel a legnagyobb valószínűséggel "F" (0,916995) lesz.

Webszolgáltatás kiadványa

Az egyes bejegyzések pontozott címkéjét és a pontozott címke valószínűségét is lekérheti. Az alaplogika az, hogy az összes pontozott valószínűség közül a legnagyobb valószínűséget kell megtalálni. Ehhez az R-szkript végrehajtása modult kell használnia. Az R-kód a 8. ábrán látható, a kísérlet eredménye pedig a 9. ábrán látható.

Példa R-kódra

8. ábra R-kód a pontozott címkék kinyeréséhez és a címkék kapcsolódó valószínűségeihez

Kísérlet eredménye

9. ábra. A levélfelismerő többosztályos besorolási probléma végső pontozási kísérlete

Miután közzétette és futtatta a webszolgáltatást, és megadott néhány bemeneti funkcióértéket, a visszaadott eredmény a 10. ábrához hasonló lesz. Ez a kézzel írt levél, amelynek kinyert 16 jellemzője, az előrejelzések szerint a "T" 0,9715 valószínűsége.

A pontozási pontszám tesztelése modul

Teszteredmény

10. ábra. Többosztályos besorolás webszolgáltatás-eredménye

Regresszió

A regressziós problémák eltérnek a besorolási problémáktól. Besorolási probléma esetén diszkrét osztályokat próbál megjósolni, például azt, hogy melyik osztályhoz tartozik egy íriszvirág. Ahogy azonban a regressziós probléma alábbi példájában látható, egy folyamatos változót próbál előrejelezni, például egy autó árát.

Példakísérlet

Használja az autóárak előrejelzését példaként a regresszióhoz. Ön megpróbálja előrejelezni az autó árát a jellemzői alapján, beleértve a make, az üzemanyag típusát, a test típusát és a meghajtó kerekét. A kísérlet a 11. ábrán látható.

Autóárak regressziós kísérlete

11. ábra. Autóárak regressziós problémáinak kísérlete

A Modell pontozása modult ábrázolva az eredmény a 12. ábrához hasonlóan néz ki.

Az autóárak előrejelzési problémájának pontozási eredményei

12. ábra. Az autóárak előrejelzési problémájának pontozási eredménye

Eredmény értelmezése

A pontozott címkék az eredményoszlop ebben a pontozási eredményben. A számok az egyes autók előrejelzett ára.

Webszolgáltatás kiadványa

A regressziós kísérletet közzéteheti egy webszolgáltatásban, és a kétosztályos besorolási használati esethez hasonlóan hívhatja meg autóárak előrejelzésére.

Az autóárak regressziós problémájának pontozási kísérlete

13. ábra. Autóárak regressziós problémájának pontozási kísérlete

A webszolgáltatás futtatása esetén a visszaadott eredmény a 14. ábrán látható. Az autó előrejelzett ára 15 085,52 dollár.

Pontozási modul értelmezése

Pontozási modul eredményei

14. ábra. Autóárak regressziós problémájának webszolgáltatással kapcsolatos eredménye

Fürtözés

Példakísérlet

Használjuk újra az Írisz-adatkészletet egy fürtözési kísérlet létrehozásához. Itt kiszűrheti az adatkészlet osztályfeliratait, így csak funkciókkal rendelkezik, és fürtözésre használható. Ebben az írisz-használati esetben adja meg a betanítási folyamat során két fürtnek kell lennie, ami azt jelenti, hogy a virágokat két osztályba csoportosítaná. A kísérlet a 15. ábrán látható.

Írisz-fürtözési problémakísérlet

15. ábra. Írisz-fürtözési problémakísérlet

A fürtözés abban különbözik a besorolástól, hogy a betanítási adatkészlet önmagában nem rendelkezik alapszintű igazságcímkékkel. A fürtözés a betanítási adatkészlet példányait különböző fürtökbe csoportosítja. A betanítási folyamat során a modell a jellemzők közötti különbségek megismerésével címkézi meg a bejegyzéseket. Ezt követően a betanított modell használható a jövőbeli bejegyzések további besorolására. Az eredménynek két része érdekli a fürtözési problémán belül. Az első rész a betanítási adatkészlet címkézése, a második pedig egy új adathalmaz besorolása a betanított modellel.

Az eredmény első része úgy jeleníthető meg, hogy a fürtözési modell betanítása bal oldali kimeneti portjára kattint, majd a Vizualizáció elemre kattint. A vizualizáció a 16. ábrán látható.

Fürtszolgáltatás eredménye

16. ábra. A betanítási adatkészlet fürtözési eredményeinek megjelenítése

A második rész eredménye, az új bejegyzések betanított fürtözési modellel való csoportosítása a 17. ábrán látható.

Fürtözés eredményének megjelenítése

17. ábra. Fürtözési eredmény megjelenítése új adatkészleten

Eredmény értelmezése

Bár a két rész eredményei különböző kísérletszakaszokból származnak, ugyanúgy néznek ki, és ugyanúgy értelmezik őket. Az első négy oszlop a funkciók. Az utolsó oszlop, a Hozzárendelések az előrejelzés eredménye. Az azonos számmal hozzárendelt bejegyzések az előrejelzés szerint ugyanabban a fürtben vannak, vagyis valamilyen módon osztoznak a hasonlóságokon (ez a kísérlet az alapértelmezett euklideszi távolságmetrikát használja). Mivel a fürtök számát 2-nek adta meg, a Hozzárendelések bejegyzései 0 vagy 1 címkével vannak ellátva.

Webszolgáltatás kiadványa

A fürtözési kísérletet közzéteheti egy webszolgáltatásban, és ugyanúgy meghívhatja fürtözési előrejelzésekhez, mint a kétosztályos besorolási használati esetben.

Írisz-fürtözési probléma pontozási kísérlete

18. ábra. Írisz-fürtözési probléma pontozási kísérlete

A webszolgáltatás futtatása után a visszaadott eredmény a 19. ábrához hasonlóan néz ki. Ez a virág az előrejelzés szerint a 0. fürtben lesz.

Pontozási modul tesztelése

Pontozási modul eredménye

19. ábra. Az írisz kétosztályos besorolásának webszolgáltatás-eredménye

Ajánlórendszer

Példakísérlet

Az ajánló rendszerek esetében példaként használhatja az éttermi ajánlási problémát: a minősítési előzmények alapján javasolhat éttermeket az ügyfeleknek. A bemeneti adatok három részből állnak:

  • Éttermi értékelések az ügyfelektől
  • Ügyfélfunkciók adatai
  • Éttermi funkciók adatai

A Machine Learning Studióban (klasszikus) a Matchbox Recommender betanítása modullal számos műveletet végezhetünk:

  • Egy adott felhasználó és elem minősítéseinek előrejelzése
  • Elemek ajánlása egy adott felhasználónak
  • Adott felhasználóhoz kapcsolódó felhasználók keresése
  • Adott elemhez kapcsolódó elemek keresése

A kívánt műveletet az Ajánló előrejelzési típus menüjében található négy lehetőség közül választva választhatja ki. Itt végigvezetheti mind a négy forgatókönyvet.

Matchbox recommender

Egy ajánlórendszer tipikus Machine Learning Studio-kísérlete (klasszikus) a 20. ábrához hasonlóan néz ki. Az ajánlórendszermodulok használatáról további információt a Matchbox-ajánló betanítása és a matchbox-ajánló pontozása című témakörben talál.

Ajánlórendszer-kísérlet

20. ábra. Ajánlórendszer-kísérlet

Eredmény értelmezése

Egy adott felhasználó és elem minősítéseinek előrejelzése

Ha az Ajánló előrejelzés típusa területen kiválasztja a Rating Prediction (Értékelés előrejelzése) lehetőséget, arra kéri az ajánlórendszert, hogy előrejelezhesse az adott felhasználó és elem értékelését. A Score Matchbox Recommender kimenet vizualizációja a 21. ábrához hasonlóan néz ki.

Az ajánlórendszer pontszáma – értékelés előrejelzése

21. ábra. Az ajánló rendszer pontszámeredményének vizualizációja – értékelés előrejelzése

Az első két oszlop a bemeneti adatok által biztosított felhasználói-elem párok. A harmadik oszlop egy adott elem felhasználójának előrejelzett minősítése. Az első sorban például az U1048-as ügyfél az étterem 135026 2-nek számít.

Elemek ajánlása egy adott felhasználónak

Ha az Ajánló előrejelzés típusa területen az Elemjavaslat lehetőséget választja, arra kéri az ajánlórendszert, hogy javasoljon elemeket egy adott felhasználónak. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter az Ajánlott elem kiválasztása. A Besorolási elemekből lehetőség (modellértékeléshez) elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Ebben az előrejelzési szakaszban az Összes elem közül választunk. A Score Matchbox Recommender kimenet vizualizációja a 22. ábrán látható.

Az ajánlórendszer pontszáma – elemjavaslat

22. ábra. Az ajánló rendszer pontszámának vizualizációja – elemjavaslat

A hat oszlop közül az első azokat a felhasználói azonosítókat jelöli, amelyekhez elemet ajánlanak a bemeneti adatoknak megfelelően. A másik öt oszlop a felhasználónak ajánlott elemeket jeleníti meg csökkenő relevancia szerint. Az első sorban például az U1048 ügyfél számára ajánlott étterem 134986, amelyet 135018, 134975, 135021 és 132862 követ.

Adott felhasználóhoz kapcsolódó felhasználók keresése

Ha a Kapcsolódó felhasználók lehetőséget választja az Ajánló előrejelzés típusa területen, arra kéri az ajánlórendszert, hogy keressen kapcsolódó felhasználókat egy adott felhasználóhoz. A kapcsolódó felhasználók azok a felhasználók, akik hasonló preferenciákkal rendelkeznek. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter a Kapcsolódó felhasználó kiválasztása. A felhasználók által minősített elemek (a modell kiértékeléséhez) lehetőség elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Válassza a Minden felhasználó lehetőséget ehhez az előrejelzési szakaszhoz. A Score Matchbox Recommender kimenet vizualizációja a 23. ábrához hasonlít.

Az ajánlórendszerhez kapcsolódó felhasználók pontszáma

23. ábra. Az ajánló rendszerhez kapcsolódó felhasználók pontszámeredményeinek vizualizációja

A hat oszlop közül az első a kapcsolódó felhasználók megkereséséhez szükséges felhasználói azonosítókat jeleníti meg a bemeneti adatoknak megfelelően. A másik öt oszlop a felhasználó előrejelzett kapcsolódó felhasználóit csökkenő relevancia szerint tárolja. Az első sorban például az U1048 ügyfél számára a leginkább releváns ügyfél az U1051, majd az U1066, az U1044, az U1017 és az U1072.

Adott elemhez kapcsolódó elemek keresése

Ha a Kapcsolódó elemek lehetőséget választja az Ajánló előrejelzési típusa területen, arra kéri az ajánlórendszert, hogy keresse meg az adott elemhez kapcsolódó elemeket. A kapcsolódó elemek azok az elemek, amelyeket valószínűleg ugyanaz a felhasználó kedvel. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter a Kapcsolódó elem kiválasztása. A Besorolási elemekből lehetőség (modellértékeléshez) elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Ehhez az előrejelzési szakaszhoz az Összes elem közül választunk. A Score Matchbox Recommender kimenet vizualizációja a 24. ábrához hasonlóan néz ki.

Az ajánlórendszer pontszáma – kapcsolódó elemek

24. ábra. Az ajánló rendszerhez kapcsolódó elemek pontszámeredményeinek megjelenítése

A hat oszlop közül az első a kapcsolódó elemek megkereséséhez szükséges elemazonosítókat jelöli a bemeneti adatoknak megfelelően. A másik öt oszlop az elem előrejelzett kapcsolódó elemeit a relevancia szempontjából csökkenő sorrendben tárolja. Az első sorban például az elem 135026 legrelevánsabb eleme 135074, amelyet 135035, 132875, 135055 és 134992 követ.

Webszolgáltatás kiadványa

A kísérletek webszolgáltatásként való közzétételének folyamata az előrejelzések lekéréséhez hasonló a négy forgatókönyv mindegyikéhez. Ebben a példában a második forgatókönyvet vesszük példaként (elemeket ajánlunk egy adott felhasználónak). Ugyanezt az eljárást követheti a másik háromhoz is.

Ha a betanított ajánlórendszert betanított modellként menti, és a bemeneti adatokat igény szerint egyetlen felhasználói azonosító oszlopra szűri, a 25. ábrán látható módon csatlakoztathatja a kísérletet, és közzéteheti webszolgáltatásként.

Az étterem javaslati problémájának pontozási kísérlete

25. ábra. Az étterem javaslati problémájának pontozási kísérlete

A webszolgáltatás futtatása esetén a visszaadott eredmény a 26. ábrához hasonlóan néz ki. Az U1048 felhasználói számára ajánlott öt étterem a 134986, 135018, 134975, 135021 és 132862.

Az ajánlórendszer-szolgáltatás mintája

Mintakísérlet eredményei

26. ábra. A webszolgáltatás éttermi javaslattal kapcsolatos problémájának eredménye