Megosztás a következőn keresztül:


Modelleredmények értelmezése a Machine Learning Studióban (klasszikus)

ÉRVÉNYES: Ez egy pipa, ami azt jelenti, hogy ez a cikk a Machine Learning Studióra (klasszikus) vonatkozik.Machine Learning Studio (klasszikus) Ez egy X, ami azt jelenti, hogy ez a cikk nem vonatkozik az Azure Machine Learningre.Azure Machine Learning

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a témakör azt ismerteti, hogyan jeleníthet meg és értelmezhet előrejelzési eredményeket a Machine Learning Studióban (klasszikus). Miután betanított egy modellt, és előrejelzéseket végzett rajta ("pontozza a modellt"), meg kell értenie és értelmeznie kell az előrejelzés eredményét.

A Machine Learning Studióban négy fő gépi tanulási modell létezik (klasszikus):

  • Osztályozás
  • Fürtözés
  • Regresszió
  • Ajánló rendszerek

Az előrejelzéshez használt modulok a következő modelleken alapulnak:

Megtudhatja, hogyan választhat paramétereket az algoritmusok optimalizálásához az ML Studio (klasszikus) alkalmazásban.

A modellek kiértékelésének módjáról a modell teljesítményének kiértékelése című témakörben olvashat.

Ha most ismerkedik az ML Studio (klasszikus) alkalmazással, megtudhatja, hogyan hozhat létre egy egyszerű kísérletet.

Osztályozás

A besorolási problémáknak két alkategóriája van:

  • Csak két osztály (kétosztályos vagy bináris besorolás) problémái
  • Két osztálynál több osztály (többosztályos besorolás) problémái

A Machine Learning Studio (klasszikus) különböző modulokkal rendelkezik az ilyen típusú besorolások kezelésére, de az előrejelzési eredmények értelmezésének módszerei hasonlóak.

Kétosztályos besorolás

Példakísérlet

Egy kétosztályos besorolási problémára példa az íriszvirágok besorolása. A feladat az íriszvirágok besorolása a jellemzőik alapján. A Machine Learning Studióban (klasszikus) biztosított írisz adatkészlet a népszerű írisz adatkészlet egy része, amely csak két virágfaj példányait tartalmazza (0. és 1. osztály). Minden virághoz négy jellemző tartozik (a sepal hossza, a sepal szélessége, a szirom hossza és a sziromszélesség).

Az íriszkísérlet képernyőképe

1. ábra Írisz kétosztályos besorolási problémakísérlet

Kísérlet történt a probléma megoldására az 1. ábrán látható módon. Betanítottunk és betanítottunk egy kétosztályos emelt szintű döntésifa-modellt. Most már vizualizálhatja az előrejelzési eredményeket a Score Model modulból a Score Model modul kimeneti portjára kattintva, majd a Vizualizáció gombra kattintva.

Modell pontozása modul

Ezzel a 2. ábrán látható pontozási eredmények jelennek meg.

Írisz kétosztályos besorolási kísérlet eredményei

2. ábra Pontszámmodell eredményének vizualizációja kétosztályos besorolásban

Eredmény értelmezése

Az eredménytáblában hat oszlop található. A bal oldali négy oszlop a négy funkció. A jobb oldali két oszlop, a Pontozott címkék és a Pontozott valószínűségek az előrejelzési eredmények. A Pontozott valószínűségek oszlop azt a valószínűséget mutatja, hogy egy virág a pozitív osztályhoz tartozik (1. osztály). Az oszlop első száma (0,028571) például azt jelenti, hogy 0,028571 annak a valószínűsége, hogy az első virág az 1. osztályba tartozik. A Pontozott címkék oszlop az egyes virágok előrejelzett osztályát jeleníti meg. Ez a Pontozott valószínűség oszlopon alapul. Ha egy virág pontozott valószínűsége nagyobb, mint 0,5, akkor az 1. osztályként van előre jelezve. Ellenkező esetben a rendszer a 0. osztályt jelzi előre.

Webszolgáltatás-kiadvány

Miután az előrejelzési eredményeket megértettük és megítéltük a hangot, a kísérlet közzétehető webszolgáltatásként, így üzembe helyezheti a különböző alkalmazásokban, és meghívhatja, hogy osztályjóslásokat szerezzen minden új íriszvirágon. Ha meg szeretné tudni, hogyan módosíthatja a betanítási kísérleteket pontozási kísérletté, és hogyan teheti közzé webszolgáltatásként, tekintse meg a 3. oktatóanyagot: Hitelkockázati modell üzembe helyezése. Ez az eljárás egy pontozási kísérletet biztosít a 3. ábrán látható módon.

Képernyőkép a pontozási kísérletről

3. ábra Az írisz kétosztályos besorolási problémakísérletének pontozása

Most be kell állítania a webszolgáltatás bemenetét és kimenetét. A bemenet a Score Model megfelelő bemeneti portja, amely az Írisz virágfunkciók bemenete. A kimenet kiválasztása attól függ, hogy érdekli-e az előrejelzett osztály (pontozott címke), a pontozott valószínűség vagy mindkettő. Ebben a példában feltételezzük, hogy mindkettő érdekli. A kívánt kimeneti oszlopok kiválasztásához használja az Oszlopok kijelölése az Adatkészlet modulban parancsot . Kattintson az Adathalmaz oszlopainak kijelölése elemre, kattintson az Oszlopkijelölő indítása, majd a Pontozott címkék és a Pontozott valószínűségek elemre. Miután beállította az Adathalmaz oszlopainak kijelölése kimeneti portját, és újra futtatta azt, készen kell állnia a pontozási kísérlet webszolgáltatásként való közzétételére a PUBLISH WEB SERVICE gombra kattintva. Az utolsó kísérlet a 4. ábrára hasonlít.

Az írisz kétosztályos besorolási kísérlet

4. ábra Egy írisz kétosztályos besorolási probléma utolsó pontozási kísérlete

Miután futtatta a webszolgáltatást, és megadta egy tesztpéldány néhány funkcióértékét, az eredmény két számot ad vissza. Az első szám a pontozott címke, a második pedig a pontozott valószínűség. Ez a virág 0,9655-ös valószínűséggel 1. osztályként van előre jelezve.

Pontszámmodell tesztelése

Pontozási teszt eredményei

5. ábra Az írisz kétosztályos besorolásának webszolgáltatás-eredménye

Többosztályos besorolás

Példakísérlet

Ebben a kísérletben egy betűfelismerő feladatot hajt végre a többosztályos besorolás példájaként. Az osztályozó megpróbál előrejelezni egy bizonyos %28class%29 betűt a kézzel írt képekből kinyert kézzel írt attribútumértékek alapján.

Példa betűfelismerőre

A betanítási adatokban 16 funkció van kinyerve kézzel írt levélképekből. A 26 betű alkotja a 26 osztályt. A 6. ábra egy olyan kísérletet mutat be, amely betanított egy többosztályos besorolási modellt a betűfelismeréshez, és előrejelezi a tesztadatkészlet ugyanazon funkciókészletét.

Betűfelismerési többosztályos besorolási kísérlet

6. ábra Betűfelismerő többosztályos besorolási problémakísérlet

A Score Model modul eredményeinek vizualizációja a Score Model modul kimeneti portjára kattintva, majd a Vizualizáció gombra kattintva a 7. ábrán látható tartalomnak kell megjelennie.

Modell eredményeinek pontszáma

7. ábra Pontszámmodell eredményeinek vizualizációja többosztályos besorolásban

Eredmény értelmezése

A bal oldali 16 oszlop a tesztkészlet funkcióértékét jelöli. Az olyan nevű oszlopok, mint a "XX" osztály pontozott valószínűségei, ugyanolyanok, mint a kétosztályos eset Pontozott valószínűség oszlopa. Azt a valószínűséget mutatják, hogy a megfelelő bejegyzés egy adott osztályba tartozik. Az első bejegyzés esetében például 0,003571 valószínűsége van annak, hogy "A", 0,000451 valószínűsége, hogy "B" és így tovább. Az utolsó oszlop (pontozott címkék) megegyezik a kétosztályos eset pontozott címkéinek oszlopával. A megfelelő bejegyzés előrejelzett osztályaként a legnagyobb pontozott valószínűséggel rendelkező osztályt választja ki. Az első bejegyzés esetében például a pontozott címke "F", mivel a legnagyobb valószínűséggel "F" (0,916995) lesz.

Webszolgáltatás-kiadvány

Az egyes bejegyzésekhez tartozó pontszámot és a pontozott címke valószínűségét is lekérheti. Az alaplogika az, hogy az összes pontozott valószínűség közül a legnagyobb valószínűséget kell megtalálni. Ehhez az R-szkript végrehajtása modult kell használnia. Az R-kód a 8. ábrán látható, a kísérlet eredménye pedig a 9. ábrán látható.

Példa R-kódra

8. ábra R-kód a pontozott címkék kinyeréséhez és a címkék kapcsolódó valószínűségeihez

Kísérlet eredménye

9. ábra A betűfelismerő többosztályos besorolási probléma utolsó pontozási kísérlete

Miután közzétette és futtatta a webszolgáltatást, és beírt néhány bemeneti funkcióértéket, a visszaadott eredmény a 10. ábrához hasonlóan néz ki. Ez a kézzel írt levél, amelynek 16 funkciója van kinyerve, 0,9715-ös valószínűséggel "T" lesz.

A pontozási pontszám tesztelése modul

Teszteredmény

10. ábra A webszolgáltatás többosztályos besorolás eredménye

Regresszió

A regressziós problémák eltérnek a besorolási problémáktól. Besorolási probléma esetén diszkrét osztályokat próbál megjósolni, például azt, hogy melyik osztályhoz tartozik egy íriszvirág. De ahogy a regressziós probléma alábbi példájában látható, egy folyamatos változót próbál előrejelezni, például egy autó árát.

Példakísérlet

Használja az autóárak előrejelzését példaként a regresszióhoz. Megpróbáljuk előrejelezni az autó árát annak jellemzői alapján, beleértve a make, az üzemanyag típusát, a karosszéria típusát és a meghajtó kerekét. A kísérlet a 11. ábrán látható.

Autóárak regressziós kísérlete

11. ábra Autóár-regressziós probléma kísérlet

A Pontozási modell modult vizualizálva az eredmény a 12. ábrához hasonlóan néz ki.

Az autóárak előrejelzési problémájának pontozási eredményei

12. ábra. Az autóárak előrejelzési problémájának pontozási eredménye

Eredmény értelmezése

A pontozott címkék az eredményoszlop ebben a pontozási eredményben. A számok az egyes autók előrejelzett ára.

Webszolgáltatás-kiadvány

A regressziós kísérletet közzéteheti egy webszolgáltatásban, és ugyanúgy hívhatja meg az autóárak előrejelzéséhez, mint a kétosztályos besorolási használati esetben.

Az autóárak regressziós problémájának pontozási kísérlete

13. ábra. Egy autóárak regressziós problémájának pontozási kísérlete

A webszolgáltatás futtatása esetén a visszaadott eredmény a 14. ábrához hasonlóan néz ki. Az autó várható ára 15 085,52 dollár.

Pontozási modul tesztelése

Pontozási modul eredményei

14. ábra. A webszolgáltatás egy autóárak regressziós problémájának eredménye

Fürtözés

Példakísérlet

Használjuk újra az Írisz-adatkészletet egy fürtözési kísérlet létrehozásához. Itt szűrheti ki az osztályfeliratokat az adatkészletben, így csak funkciókkal rendelkezik, és fürtözésre használható. Ebben az íriszhasználati esetben adja meg a betanítási folyamat során két fürt számát, ami azt jelenti, hogy a virágokat két osztályba csoportosítaná. A kísérlet a 15. ábrán látható.

Írisz-fürtözési problémakísérlet

15. ábra. Írisz-fürtözési problémakísérlet

A fürtözés abban különbözik a besorolástól, hogy a betanítási adatkészlet önmagában nem rendelkezik alapigaz címkékvel. A fürtözés a betanítási adatkészlet példányait különböző fürtökbe csoportosítja. A betanítási folyamat során a modell a funkciók közötti különbségek megismerésével címkézi a bejegyzéseket. Ezt követően a betanított modell használható a jövőbeli bejegyzések további besorolására. Az eredménynek két része érdekli a fürtözési problémán belül. Az első rész a betanítási adatkészlet címkézése, a második pedig egy új adatkészlet besorolása a betanított modellel.

Az eredmény első része vizualizálható a fürtmodell betanításának bal kimeneti portjára kattintva, majd a Vizualizáció gombra kattintva. A vizualizáció a 16. ábrán látható.

Fürtszolgáltatás eredménye

16. ábra. A betanítási adatkészlet fürtözési eredményének megjelenítése

A második rész, az új bejegyzések betanított fürtözési modellel való fürtözésének eredménye a 17. ábrán látható.

Fürtözési eredmény vizualizációja

17. ábra. Fürtözési eredmény megjelenítése új adatkészleten

Eredmény értelmezése

Bár a két rész eredményei különböző kísérletszakaszokból származnak, ugyanúgy néznek ki, és ugyanúgy értelmezik őket. Az első négy oszlop funkciók. Az utolsó oszlop, a Hozzárendelések az előrejelzés eredménye. Az azonos számmal hozzárendelt bejegyzések az előrejelzés szerint ugyanabban a fürtben vannak, vagyis valamilyen módon osztoznak a hasonlóságokon (ez a kísérlet az alapértelmezett euklideszi távolságmetrikát használja). Mivel a fürtök számát 2-nek adta meg, a hozzárendelések bejegyzései 0 vagy 1 címkével vannak ellátva.

Webszolgáltatás-kiadvány

A fürtözési kísérletet közzéteheti egy webszolgáltatásban, és ugyanúgy meghívhatja fürtözési előrejelzésekhez, mint a kétosztályos besorolási használati esetben.

Íriszfürt-fürtkezelési probléma pontozási kísérlete

18. ábra. Íriszfürt-probléma pontozási kísérlete

A webszolgáltatás futtatása után a visszaadott eredmény a 19. ábrához hasonlóan néz ki. Ez a virág az előrejelzések szerint a 0. fürtben lesz.

Pontozási modul tesztelése

Pontozási modul eredménye

19. ábra. Az írisz kétosztályos besorolásának webszolgáltatás-eredménye

Ajánló rendszer

Példakísérlet

Az ajánlórendszerek esetében példaként használhatja az éttermi ajánlási problémát: a minősítési előzmények alapján javasolhat éttermeket az ügyfeleknek. A bemeneti adatok három részből állnak:

  • Éttermi értékelések az ügyfelektől
  • Ügyfélfunkciók adatai
  • Éttermi szolgáltatási adatok

A Machine Learning Studióban (klasszikus) a Matchbox-ajánló betanítása modullal számos dolgot tehetünk:

  • Egy adott felhasználó és elem minősítésének előrejelzése
  • Elemek ajánlása egy adott felhasználónak
  • Adott felhasználóhoz kapcsolódó felhasználók keresése
  • Adott elemhez kapcsolódó elemek keresése

A kívánt műveletet az Ajánló előrejelzési típus menüjében található négy lehetőség közül választhatja ki. Itt végigvezetheti mind a négy forgatókönyvet.

Matchbox recommender

Egy ajánlórendszer tipikus Machine Learning Studio-kísérlete (klasszikus) a 20. ábrához hasonlóan néz ki. Az ajánló rendszermodulok használatáról további információt a Matchbox-ajánló és a Score matchbox recommender című témakörben talál.

Javaslatt indító rendszerkísérlet

20. ábra. Javaslatt indító rendszerkísérlet

Eredmény értelmezése

Egy adott felhasználó és elem minősítésének előrejelzése

Ha kiválasztja a Rating Prediction (Értékelés előrejelzése) lehetőséget az Ajánló előrejelzés típusa területen, arra kéri az ajánlórendszert, hogy előrejelezhesse az adott felhasználó és elem minősítését. A Score Matchbox Recommender kimenet vizualizációja a 21. ábrához hasonlóan néz ki.

Az ajánlórendszer pontszáma – értékelés előrejelzése

21. ábra. Az ajánló rendszer pontszámeredményének vizualizációja – értékelés előrejelzése

Az első két oszlop a bemeneti adatok által biztosított felhasználói-elem párok. A harmadik oszlop egy adott elem felhasználójának előrejelzett minősítése. Az első sorban például az U1048-as ügyfél az étterem 135026 2-esnek számít.

Elemek ajánlása egy adott felhasználónak

Ha az Ajánló előrejelzés típusa területen az Elemjavaslat lehetőséget választja, arra kéri az ajánlórendszert, hogy javasoljon elemeket egy adott felhasználónak. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter az Ajánlott elem kiválasztása. A Besorolási elemekből (modellértékeléshez) lehetőség elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Ebben az előrejelzési szakaszban az Összes elem közül választunk. A Score Matchbox Recommender kimenet vizualizációja a 22. ábrához hasonlóan néz ki.

Az ajánlórendszer pontszáma – elemjavaslat

22. ábra. Az ajánló rendszer pontszámeredményének vizualizációja – elemjavaslat

A hat oszlop közül az első azokat a felhasználói azonosítókat jelöli, amelyekhez a bemeneti adatok által megadott elemeket javasolni kell. A másik öt oszlop azokat az elemeket jelöli, amelyek a felhasználó számára ajánlottak csökkenő relevancia szerint. Az első sorban például az U1048-ügyfél számára ajánlott étterem 134986, amelyet 135018, 134975, 135021 és 132862 követ.

Adott felhasználóhoz kapcsolódó felhasználók keresése

Ha a Kapcsolódó felhasználók lehetőséget választja az Ajánló előrejelzés típusa alatt, arra kéri az ajánlórendszert, hogy keresse meg az adott felhasználóhoz kapcsolódó felhasználókat. A kapcsolódó felhasználók azok a felhasználók, akik hasonló beállításokkal rendelkeznek. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter a Kapcsolódó felhasználó kiválasztása. A felhasználók által minősített elemek (a modell kiértékeléséhez) lehetőség elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Ehhez az előrejelzési fázishoz válassza a Minden felhasználó lehetőséget. A Score Matchbox Recommender kimenet vizualizációja a 23. ábrához hasonlóan néz ki.

Az ajánlórendszerhez kapcsolódó felhasználók pontszáma

23. ábra. Az ajánló rendszerhez kapcsolódó felhasználók pontszámának megjelenítése

A hat oszlop közül az első a kapcsolódó felhasználók megkereséséhez szükséges felhasználói azonosítókat jeleníti meg, a bemeneti adatoknak megfelelően. A másik öt oszlop csökkenő fontosságú sorrendben tárolja a felhasználó előrejelzett kapcsolódó felhasználóit. Az első sorban például az U1048 ügyfél szempontjából a legrelevánsabb ügyfél az U1051, majd az U1066, az U1044, az U1017 és az U1072.

Adott elemhez kapcsolódó elemek keresése

Ha a Kapcsolódó elemek lehetőséget választja az Ajánló előrejelzés típusa területen, arra kéri az ajánlórendszert, hogy keresse meg az adott elemhez kapcsolódó elemeket. A kapcsolódó elemek azok az elemek, amelyeket valószínűleg ugyanaz a felhasználó kedvel. Ebben a forgatókönyvben az utolsó kiválasztandó paraméter a Kapcsolódó elem kiválasztása. A Besorolási elemekből (modellértékeléshez) lehetőség elsősorban a modell kiértékeléséhez használható a betanítási folyamat során. Ehhez az előrejelzési fázishoz az Összes elem lehetőséget választjuk. A Score Matchbox Recommender kimenet vizualizációja a 24. ábrához hasonlóan néz ki.

Az ajánlórendszer eredményének pontszáma – kapcsolódó elemek

24. ábra. Az ajánló rendszerhez kapcsolódó elemek pontszámának megjelenítése

A hat oszlop közül az első a kapcsolódó elemek megkereséséhez szükséges adott elemazonosítókat jelöli a bemeneti adatoknak megfelelően. A másik öt oszlop a relevancia szempontjából csökkenő sorrendben tárolja az elem előrejelzett kapcsolódó elemeit. Az első sorban például az elem 135026 legrelevánsabb eleme a 135074, majd a 135035, 132875, 135055 és 134992.

Webszolgáltatás-kiadvány

A kísérletek webes szolgáltatásként való közzétételének folyamata az előrejelzések lekéréséhez hasonló a négy forgatókönyv mindegyikéhez. Ebben a példában a második forgatókönyvet vesszük példaként (elemeket ajánlunk egy adott felhasználónak). Ugyanezt az eljárást a másik háromnál is követheti.

A betanított ajánlórendszert betanított modellként mentve, és a bemeneti adatokat igény szerint egyetlen felhasználói azonosító oszlopra szűrve csatlakoztathatja a kísérletet a 25. ábrához hasonlóan, és közzéteheti webszolgáltatásként.

Az étterem ajánlási problémájának pontozási kísérlete

25. ábra. Az étterem ajánlási problémájának pontozási kísérlete

A webszolgáltatás futtatásával a visszaadott eredmény a 26. ábrához hasonlóan néz ki. Az U1048 felhasználóinak ajánlott öt étterem 134986, 135018, 134975, 135021 és 132862.

Minta az ajánlórendszer-szolgáltatásból

Mintakísérletek eredményei

26. ábra. A webszolgáltatás éttermi javaslattal kapcsolatos problémájának eredménye