A permutáció funkció fontossága
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Kiszámítja a tulajdonságváltozók permutációs funkció fontosságpontszámait egy betanított modell és egy tesztadatkészlet alapján
Kategória: Funkcióválasztási modulok
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a permutáció funkció fontossága modul a Machine Learning Studio (klasszikus) alkalmazásában az adathalmaz funkcióbeli fontosságpontszámainak kiszámításához. Ezekkel a pontszámokkal meghatározhatja a modellben használható legjobb jellemzőket.
Ebben a modulban a jellemzőértékek véletlenszerűen vannak megkeverve, oszlopról oszlopra oszlva, és a modell teljesítményét előtte és utána mérjük. A teljesítmény méréséhez választhat a standard metrikák közül.
A modul által visszaadott pontszámok a betanított modell teljesítményének a permutáció utáni változását képviselik. A fontos jellemzők általában érzékenyebbek a ékezés folyamatára, ezért nagyobb fontosságú pontszámokat eredményeznek.
Ez a cikk általános áttekintést nyújt a permutációs funkciók fontosságáról, elméleti alapról és a gépi tanulásban alkalmazott alkalmazásairól: Permutáció funkció fontossága
A permutáció funkció fontosságának használata
A funkciópontszámok készletének létrehozásához egy már betanított modellre és egy tesztadatkészletre van szükség.
Adja hozzá a permutáció funkció fontossága modult a kísérlethez. Ezt a modult a Funkcióválasztás kategóriában találja .
Csatlakozás egy betanított modellt a bal oldali bemenethez. A modellnek regressziós modellnek vagy besorolási modellnek kell lennie.
A jobb bemeneten kössen össze egy adatkészletet, lehetőleg olyat, amely különbözik a modell betanítása során használt adatkészlettől. Ez az adatkészlet a betanított modell alapján való pontozáshoz, valamint a modell kiértékeléhez használható a jellemzőértékek módosulása után.
Véletlenszerű kezdőérték esetén írjon be egy értéket, amely a véletlenszerűsítés kezdőértékeként lesz használva. Ha a 0 értéket adja meg (ez az alapértelmezett érték), a rendszer a rendszeróra alapján generál egy számot.
A kezdőérték megadása nem kötelező, de meg kell adnia egy értéket, ha reprodukálhatóságot szeretne ugyanazon kísérlet futtatásai között.
A Teljesítménymérési metrika beállításnál válassza ki a modell minőségének permutáció utáni kiszámításához használni kívánt metrikát.
Machine Learning Studio (klasszikus) a következő metrikákat támogatja attól függően, hogy besorolási vagy regressziós modellt értékel ki:
Osztályozás
Pontosság, pontosság, felidézés, átlagos naplóvesztés
Regresszió
Pontosság, előhívás, átlagos abszolút hiba, gyökér-négyzetes eltérés, relatív abszolút hiba, relatív négyzetes eltérés, meghatározási együttható
A kiértékelési metrikák részletesebb leírását és kiszámításának módját az Értékelés ismertetőben láthatja.
Futtassa a kísérletet.
A modul egy listát ad a jellemzőoszlopokról és a hozzájuk kapcsolódó pontszámokról, a pontszámok szerint rangsorolva, csökkenő sorrendben.
Példák
Tekintse meg ezeket a mintakísérleteket a Azure AI Gallery:
Permutáció funkció fontossága: Bemutatja, hogyan rangsorolja a modul egy adatkészlet jellemzőváltozóit a permutáció fontosságai pontszámai szerint.
A Permutation Feature Importance (Permutáció funkció fontossága) modul használata: A modul webszolgáltatásban való használatát mutatja be.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
Hogyan viszonyul ez más funkcióválasztási módszerekhez?
A permutáció funkció fontossága úgy működik, hogy véletlenszerűen módosítja az egyes jellemzőoszlopok értékeit, egyszerre egy oszlopot, majd kiértékeli a modellt.
A permutáció funkció fontossága által biztosított rangsorolások gyakran eltérnek a Szűrőalapú funkcióválasztástól származóaktól , amely kiszámítja a pontszámokat a modell létrehozása előtt.
Ennek az az oka, hogy a permutációs funkció fontossága nem méri a funkció és a célérték közötti társítást, hanem azt, hogy az egyes funkciók milyen hatással vannak a modell előrejelzésére.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Betanított modell | ILearner interfész | Betanított besorolási vagy regressziós modell |
Tesztadatok | Adattábla | Az adatkészlet tesztelése a modell pontozására és kiértékelére a jellemzőértékek permutációja után |
Modulparaméterek
Név | Típus | Tartomány | Választható | Alapértelmezett | Description |
---|---|---|---|---|---|
Véletlenszerű mag | Egész szám | >=0 | Kötelező | 0 | Véletlenszám-generátor kezdőértéke |
Teljesítménymérési metrika | EvaluationMetricType (Kiértékelésimetritípus) | select from list (kijelölés listából) | Kötelező | Besorolás – Pontosság | Válassza ki a modell permutációk utáni változékonyságának kiértékelése során használni kívánt metrikát |
Kimenetek
Név | Típus | Description |
---|---|---|
A funkció fontossága | Adattábla | A funkció fontosságának eredményeit tartalmazó adatkészlet a kiválasztott metrika alapján |
Kivételek
Kivétel | Description |
---|---|
0062-es hiba | Kivétel történik két modell különböző tanulótípusokkal való összehasonlításának megkísérlésében. |
0024-es hiba | Kivétel akkor fordul elő, ha az adatkészlet nem tartalmaz címkeoszlopot. |
0105-ös hiba | Akkor ad vissza, ha egy moduldefiníciós fájl nem támogatott paramétertípust határoz meg |
0021-es hiba | Kivétel akkor fordul elő, ha a modulnak átadott egyes adathalmazok sorai túl kicsiek. |
Lásd még
Funkció kiválasztása
Szűrőalapú szolgáltatásválasztás
Fő összetevő elemzése