A permutáció funkció fontossága
Ez a cikk azt ismerteti, hogyan használhatja a Permutation feature Importance összetevőt az Azure Machine Learning Designerben az adathalmaz funkció-fontossági pontszámainak kiszámításához. Ezekkel a pontszámokkal meghatározhatja a modellben használandó legjobb funkciókat.
Ebben az összetevőben a funkcióértékek véletlenszerűen vannak elosztásban, egyszerre egy oszlopban. A modell teljesítményét előtte és utána mérik. A teljesítmény méréséhez választhatja ki a standard metrikák egyikét.
Az összetevő által visszaadott pontszámok a betanított modell teljesítménybeli változását jelzik a permutáció után. A fontos funkciók általában érzékenyebbek az elosztási folyamatra, így nagyobb fontossági pontszámot eredményeznek.
Ez a cikk áttekintést nyújt a permutációs funkcióról, annak elméleti alapjairól és a gépi tanulásban alkalmazható alkalmazásairól: A permutációs funkció fontossága.
A permutációs funkció fontossága
A funkciópontszám-készlet létrehozásához rendelkeznie kell egy már betanított modellel és egy tesztadatkészlettel.
Adja hozzá a Permutation Feature Importance összetevőt a folyamathoz. Ezt az összetevőt a Funkcióválasztás kategóriában találja.
Csatlakoztassa a betanított modellt a bal oldali bemenethez. A modellnek regressziós vagy besorolási modellnek kell lennie.
A jobb oldali bemeneten csatlakoztassa az adathalmazt. Lehetőleg olyant válasszon, amely eltér a modell betanításához használt adatkészlettől. Ez az adatkészlet a betanított modell alapján történő pontozáshoz használatos. A modell kiértékelésére is használatos a funkcióértékek módosítása után.
Véletlenszerű mag esetén adjon meg egy értéket, amelyet a véletlenszerűsítéshez magként szeretne használni. Ha a 0 értéket adja meg (ez az alapértelmezett érték), a rendszer a rendszerórán alapuló számot hoz létre.
A kezdőérték megadása nem kötelező, de meg kell adnia egy értéket, ha ugyanazon folyamat futtatásai között szeretne reprodukálni.
A Teljesítmény mérésére szolgáló metrika beállításnál válasszon ki egyetlen metrikát, amelyet a modellminőség permutáció utáni számításakor használ.
Az Azure Machine Learning Designer a következő metrikákat támogatja attól függően, hogy egy besorolási vagy regressziós modellt értékel ki:
Osztályozás
Pontosság, pontosság, visszahívás
Regresszió
Pontosság, visszahívás, átlagos abszolút hiba, gyökér középérték négyzetes hiba, relatív abszolút hiba, relatív négyzetes hiba, meghatározási együttható
A kiértékelési metrikák részletesebb leírásáért és azok kiszámításának módjáért lásd: Modell kiértékelése.
Küldje el a folyamatot.
Az összetevő megjeleníti a funkcióoszlopok listáját és a hozzájuk tartozó pontszámokat. A lista a pontszámok csökkenő sorrendjében van rangsorolva.
Technikai megjegyzések
A permutációs funkció fontossága úgy működik, hogy véletlenszerűen módosítja az egyes funkcióoszlopok értékeit, egyenként egy oszlopban. Ezután kiértékeli a modellt.
Az összetevő által biztosított rangsorok gyakran eltérnek a szűrőalapú funkcióválasztásból kapott rangsoroktól. A szűrőalapú szolgáltatás kiválasztása kiszámítja a pontszámokat a modell létrehozása előtt .
A különbség oka az, hogy a permutációs funkció fontossága nem méri a funkció és a célérték közötti társítást. Ehelyett azt rögzíti, hogy az egyes funkciók mekkora hatással vannak a modell előrejelzéseire.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket .
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: