Megosztás a következőn keresztül:


A permutáció funkció fontossága

Ez a cikk azt ismerteti, hogyan használhatja a Permutation feature Importance összetevőt az Azure Machine Learning Designerben az adathalmaz funkció-fontossági pontszámainak kiszámításához. Ezekkel a pontszámokkal meghatározhatja a modellben használandó legjobb funkciókat.

Ebben az összetevőben a funkcióértékek véletlenszerűen vannak elosztásban, egyszerre egy oszlopban. A modell teljesítményét előtte és utána mérik. A teljesítmény méréséhez választhatja ki a standard metrikák egyikét.

Az összetevő által visszaadott pontszámok a betanított modell teljesítménybeli változását jelzik a permutáció után. A fontos funkciók általában érzékenyebbek az elosztási folyamatra, így nagyobb fontossági pontszámot eredményeznek.

Ez a cikk áttekintést nyújt a permutációs funkcióról, annak elméleti alapjairól és a gépi tanulásban alkalmazható alkalmazásairól: A permutációs funkció fontossága.

A permutációs funkció fontossága

A funkciópontszám-készlet létrehozásához rendelkeznie kell egy már betanított modellel és egy tesztadatkészlettel.

  1. Adja hozzá a Permutation Feature Importance összetevőt a folyamathoz. Ezt az összetevőt a Funkcióválasztás kategóriában találja.

  2. Csatlakoztassa a betanított modellt a bal oldali bemenethez. A modellnek regressziós vagy besorolási modellnek kell lennie.

  3. A jobb oldali bemeneten csatlakoztassa az adathalmazt. Lehetőleg olyant válasszon, amely eltér a modell betanításához használt adatkészlettől. Ez az adatkészlet a betanított modell alapján történő pontozáshoz használatos. A modell kiértékelésére is használatos a funkcióértékek módosítása után.

  4. Véletlenszerű mag esetén adjon meg egy értéket, amelyet a véletlenszerűsítéshez magként szeretne használni. Ha a 0 értéket adja meg (ez az alapértelmezett érték), a rendszer a rendszerórán alapuló számot hoz létre.

    A kezdőérték megadása nem kötelező, de meg kell adnia egy értéket, ha ugyanazon folyamat futtatásai között szeretne reprodukálni.

  5. A Teljesítmény mérésére szolgáló metrika beállításnál válasszon ki egyetlen metrikát, amelyet a modellminőség permutáció utáni számításakor használ.

    Az Azure Machine Learning Designer a következő metrikákat támogatja attól függően, hogy egy besorolási vagy regressziós modellt értékel ki:

    • Osztályozás

      Pontosság, pontosság, visszahívás

    • Regresszió

      Pontosság, visszahívás, átlagos abszolút hiba, gyökér középérték négyzetes hiba, relatív abszolút hiba, relatív négyzetes hiba, meghatározási együttható

    A kiértékelési metrikák részletesebb leírásáért és azok kiszámításának módjáért lásd: Modell kiértékelése.

  6. Küldje el a folyamatot.

  7. Az összetevő megjeleníti a funkcióoszlopok listáját és a hozzájuk tartozó pontszámokat. A lista a pontszámok csökkenő sorrendjében van rangsorolva.

Technikai megjegyzések

A permutációs funkció fontossága úgy működik, hogy véletlenszerűen módosítja az egyes funkcióoszlopok értékeit, egyenként egy oszlopban. Ezután kiértékeli a modellt.

Az összetevő által biztosított rangsorok gyakran eltérnek a szűrőalapú funkcióválasztásból kapott rangsoroktól. A szűrőalapú szolgáltatás kiválasztása kiszámítja a pontszámokat a modell létrehozása előtt .

A különbség oka az, hogy a permutációs funkció fontossága nem méri a funkció és a célérték közötti társítást. Ehelyett azt rögzíti, hogy az egyes funkciók mekkora hatással vannak a modell előrejelzéseire.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .