Megosztás a következőn keresztül:


A permutáció funkció fontossága

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Kiszámítja a tulajdonságváltozók permutációs funkció fontosságpontszámait egy betanított modell és egy tesztadatkészlet alapján

Kategória: Funkcióválasztási modulok

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a permutáció funkció fontossága modul a Machine Learning Studio (klasszikus) alkalmazásában az adathalmaz funkcióbeli fontosságpontszámainak kiszámításához. Ezekkel a pontszámokkal meghatározhatja a modellben használható legjobb jellemzőket.

Ebben a modulban a jellemzőértékek véletlenszerűen vannak megkeverve, oszlopról oszlopra oszlva, és a modell teljesítményét előtte és utána mérjük. A teljesítmény méréséhez választhat a standard metrikák közül.

A modul által visszaadott pontszámok a betanított modell teljesítményének a permutáció utáni változását képviselik. A fontos jellemzők általában érzékenyebbek a ékezés folyamatára, ezért nagyobb fontosságú pontszámokat eredményeznek.

Ez a cikk általános áttekintést nyújt a permutációs funkciók fontosságáról, elméleti alapról és a gépi tanulásban alkalmazott alkalmazásairól: Permutáció funkció fontossága

A permutáció funkció fontosságának használata

A funkciópontszámok készletének létrehozásához egy már betanított modellre és egy tesztadatkészletre van szükség.

  1. Adja hozzá a permutáció funkció fontossága modult a kísérlethez. Ezt a modult a Funkcióválasztás kategóriában találja .

  2. Csatlakozás egy betanított modellt a bal oldali bemenethez. A modellnek regressziós modellnek vagy besorolási modellnek kell lennie.

  3. A jobb bemeneten kössen össze egy adatkészletet, lehetőleg olyat, amely különbözik a modell betanítása során használt adatkészlettől. Ez az adatkészlet a betanított modell alapján való pontozáshoz, valamint a modell kiértékeléhez használható a jellemzőértékek módosulása után.

  4. Véletlenszerű kezdőérték esetén írjon be egy értéket, amely a véletlenszerűsítés kezdőértékeként lesz használva. Ha a 0 értéket adja meg (ez az alapértelmezett érték), a rendszer a rendszeróra alapján generál egy számot.

    A kezdőérték megadása nem kötelező, de meg kell adnia egy értéket, ha reprodukálhatóságot szeretne ugyanazon kísérlet futtatásai között.

  5. A Teljesítménymérési metrika beállításnál válassza ki a modell minőségének permutáció utáni kiszámításához használni kívánt metrikát.

    Machine Learning Studio (klasszikus) a következő metrikákat támogatja attól függően, hogy besorolási vagy regressziós modellt értékel ki:

    • Osztályozás

      Pontosság, pontosság, felidézés, átlagos naplóvesztés

    • Regresszió

      Pontosság, előhívás, átlagos abszolút hiba, gyökér-négyzetes eltérés, relatív abszolút hiba, relatív négyzetes eltérés, meghatározási együttható

    A kiértékelési metrikák részletesebb leírását és kiszámításának módját az Értékelés ismertetőben láthatja.

  6. Futtassa a kísérletet.

  7. A modul egy listát ad a jellemzőoszlopokról és a hozzájuk kapcsolódó pontszámokról, a pontszámok szerint rangsorolva, csökkenő sorrendben.

Példák

Tekintse meg ezeket a mintakísérleteket a Azure AI Gallery:

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Hogyan viszonyul ez más funkcióválasztási módszerekhez?

A permutáció funkció fontossága úgy működik, hogy véletlenszerűen módosítja az egyes jellemzőoszlopok értékeit, egyszerre egy oszlopot, majd kiértékeli a modellt.

A permutáció funkció fontossága által biztosított rangsorolások gyakran eltérnek a Szűrőalapú funkcióválasztástól származóaktól , amely kiszámítja a pontszámokat a modell létrehozása előtt.

Ennek az az oka, hogy a permutációs funkció fontossága nem méri a funkció és a célérték közötti társítást, hanem azt, hogy az egyes funkciók milyen hatással vannak a modell előrejelzésére.

Várt bemenetek

Név Típus Description
Betanított modell ILearner interfész Betanított besorolási vagy regressziós modell
Tesztadatok Adattábla Az adatkészlet tesztelése a modell pontozására és kiértékelére a jellemzőértékek permutációja után

Modulparaméterek

Név Típus Tartomány Választható Alapértelmezett Description
Véletlenszerű mag Egész szám >=0 Kötelező 0 Véletlenszám-generátor kezdőértéke
Teljesítménymérési metrika EvaluationMetricType (Kiértékelésimetritípus) select from list (kijelölés listából) Kötelező Besorolás – Pontosság Válassza ki a modell permutációk utáni változékonyságának kiértékelése során használni kívánt metrikát

Kimenetek

Név Típus Description
A funkció fontossága Adattábla A funkció fontosságának eredményeit tartalmazó adatkészlet a kiválasztott metrika alapján

Kivételek

Kivétel Description
0062-es hiba Kivétel történik két modell különböző tanulótípusokkal való összehasonlításának megkísérlésében.
0024-es hiba Kivétel akkor fordul elő, ha az adatkészlet nem tartalmaz címkeoszlopot.
0105-ös hiba Akkor ad vissza, ha egy moduldefiníciós fájl nem támogatott paramétertípust határoz meg
0021-es hiba Kivétel akkor fordul elő, ha a modulnak átadott egyes adathalmazok sorai túl kicsiek.

Lásd még

Funkció kiválasztása
Szűrőalapú szolgáltatásválasztás
Fő összetevő elemzése