Modell-hiperparaméterek hangolása

Cikk
06/01/2023

Ez a cikk bemutatja, hogyan használhatja a Modell hiperparaméterek hangolása összetevőt az Azure Machine Learning Designerben. A cél egy gépi tanulási modell optimális hiperparamétereinek meghatározása. Az összetevő több modellt fejleszt és tesztel különböző beállításkombinációk használatával. Összehasonlítja a metrikákat az összes modellel a beállítások kombinációinak lekéréséhez.

A paraméter és a hiperparaméter kifejezés zavaró lehet. A modell paraméterei az összetevő jobb oldali paneljén beállított paraméterek . Ez az összetevő alapvetően egy paraméter-átvizsgálást végez a megadott paraméterbeállításokon. Megtanulja a hiperparaméterek optimális készletét, amelyek minden egyes döntési fához, adatkészlethez vagy regressziós módszerhez eltérőek lehetnek. Az optimális konfiguráció megtalálásának folyamatát néha hangolásnak is nevezik.

Az összetevő a következő módszert támogatja a modell optimális beállításainak megtalálásához: integrált betanítás és hangolás. Ebben a metódusban konfigurálja a használni kívánt paraméterek készletét. Ezután hagyja, hogy az összetevő több kombináción át iteráljon. Az összetevő addig méri a pontosságot, amíg meg nem találja a "legjobb" modellt. A legtöbb tanulói összetevő esetében kiválaszthatja, hogy mely paramétereket kell módosítani a betanítási folyamat során, és melyek maradjanak javítva.

Attól függően, hogy mennyi ideig szeretné futtatni a hangolási folyamatot, dönthet úgy, hogy teljes körűen teszteli az összes kombinációt. Vagy lerövidítheti a folyamatot a paraméterkombinációk rácsának létrehozásával és a paraméterrács véletlenszerű részhalmazának tesztelésével.

Ez a metódus létrehoz egy betanított modellt, amelyet újra felhasználhat.

Tipp

A kapcsolódó feladatokat elvégezheti. Mielőtt elkezdené a finomhangolást, alkalmazzon funkciókijelölést a legmagasabb információs értékkel rendelkező oszlopok vagy változók meghatározásához.

Modellparaméterek hangolásának konfigurálása

A gépi tanulási modell optimális hiperparamétereinek elsajátításához jelentős folyamathasználatra van szükség.

Modell betanítása paramétersöpréssel

Ez a szakasz bemutatja, hogyan hajthat végre egy alapszintű paraméter-átvizsgálást, amely a Modell hiperparaméterek hangolása összetevővel tanítja be a modellt.

Adja hozzá a Modell hiperparaméterek hangolása összetevőt a folyamathoz a tervezőben.
Csatlakoztassa a nem betanított modellt a bal szélső bemenethez.

Megjegyzés

A modell hiperparamétereinek finomhangolása csak beépített gépi tanulási algoritmus-összetevőkhöz csatlakoztatható, és nem támogatja a Python-modell létrehozása beépített testreszabott modellt.
Adja hozzá a betanításhoz használni kívánt adatkészletet, és csatlakoztassa a modell hiperparamétereinek hangolása középső bemenetéhez.

Ha címkézett adatkészlettel rendelkezik, csatlakoztathatja azt a jobb szélső bemeneti porthoz (opcionális érvényesítési adatkészlet). Ez lehetővé teszi a pontosság mérését betanítás és finomhangolás közben.
A Modell hiperparamétereinek finomhangolása panelen válasszon egy értéket a Paramétersöprési módhoz. Ez a beállítás szabályozza a paraméterek kiválasztásának módját.
- Teljes rács: Ha ezt a lehetőséget választja, az összetevő egy, a rendszer által előre meghatározott rács fölé hurkol, hogy különböző kombinációkat próbáljon ki, és azonosítsa a legjobb tanulót. Ez a beállítás akkor hasznos, ha nem tudja, mi lehet a legjobb paraméterbeállítások, és ki szeretné próbálni az értékek összes lehetséges kombinációját.
- Véletlenszerű takarítás: Ha ezt a lehetőséget választja, az összetevő véletlenszerűen választja ki a paraméterértékeket egy rendszer által meghatározott tartományban. Meg kell adnia az összetevő által végrehajtandó futtatások maximális számát. Ez a lehetőség akkor hasznos, ha a kívánt metrikákkal szeretné növelni a modell teljesítményét, de így is megőrizheti a számítási erőforrásokat.
A Címke oszlopnál nyissa meg az oszlopválasztót egyetlen címkeoszlop kiválasztásához.
Válassza ki a futtatások számát:
- Véletlenszerű takarítás esetén a futtatások maximális száma: Ha véletlenszerű takarítást választ, megadhatja, hogy a modell hányszor legyen betanításra a paraméterértékek véletlenszerű kombinációjával.
A Rangsorolás területen válasszon ki egyetlen metrikát a modellek rangsorolásához.

Paraméter-takarítás futtatásakor az összetevő kiszámítja a modell típusára vonatkozó összes vonatkozó metrikát, és visszaadja őket a Takarítási eredmények jelentésben. Az összetevő külön metrikákat használ a regressziós és besorolási modellekhez.

A választott metrika azonban meghatározza a modellek rangsorolását. Csak a kiválasztott metrika által rangsorolt legfelső modell a kimenet betanított modellként, amely a pontozáshoz használható.
Véletlenszerű mag esetén adjon meg egy egész számot egy pszeudo véletlenszám-generátor állapotként, amelyet a paraméterértékek véletlenszerű kiválasztásához használnak egy előre meghatározott tartományon keresztül. Ez a paraméter csak akkor hatékony, ha a paramétersöprési módvéletlenszerű takarítás.
Küldje el a folyamatot.

A hiperparaméter finomhangolásának eredményei

Ha a betanítás befejeződött:

A takarítási eredmények megtekintéséhez kattintson a jobb gombbal az összetevőre, majd válassza a Vizualizáció lehetőséget, vagy kattintson a jobb gombbal az összetevő bal oldali kimeneti portjára a vizualizációhoz.

A takarítási eredmények tartalmazzák a modell típusára vonatkozó összes paraméteres takarítási és pontossági metrikát, és a rangsoroláshoz kiválasztott metrika határozza meg, hogy melyik modell minősül a "legjobbnak".
A betanított modell pillanatképének mentéséhez válassza a Kimenetek+naplók lapot a Modell betanítása összetevő jobb oldali paneljén. Válassza az Adathalmaz regisztrálása ikont a modell újrafelhasználható összetevőként való mentéséhez.

Technikai megjegyzések

Ez a szakasz a megvalósítás részleteit és tippeket tartalmazza.

A paraméteres takarítás működése

A paraméteres takarítás beállításakor meg kell határoznia a keresés hatókörét. A keresés a véletlenszerűen kiválasztott paraméterek véges számát is használhatja. Vagy egy definiált paraméterterület teljes körű keresése is lehet.

Véletlenszerű takarítás: Ez a beállítás meghatározott számú iterációval tanít be egy modellt.

Meg kell adnia egy értéktartományt, amelyet át kell iterálni, és az összetevő az értékek véletlenszerűen kiválasztott részhalmazát használja. Az értékeket helyettesítő értékekkel választja ki, ami azt jelenti, hogy a korábban véletlenszerűen kiválasztott számok nem lesznek eltávolítva a rendelkezésre álló számok készletéből. Így a kiválasztott értékek esélye minden passzban változatlan marad.
Teljes rács: A teljes rács használata azt jelenti, hogy minden kombinációt tesztelnek. Ez a lehetőség a legáttekintőbb, de a legtöbb időt igényli.

A betanítás hosszának és összetettségének szabályozása

A beállítások számos kombinációjának iterálása időigényes lehet, ezért az összetevő számos módot kínál a folyamat korlátozására:

A modell teszteléséhez használt iterációk számának korlátozása.
Korlátozza a paraméterterületet.
Korlátozza az iterációk számát és a paraméterterületet is.

Javasoljuk, hogy az adott adathalmazra és modellre vonatkozó betanítási módszer leghatékonyabb módszerének meghatározásához a beállításokat használja.

Értékelési metrikák kiválasztása

A tesztelés végén a modell egy jelentést jelenít meg, amely az egyes modellek pontosságát tartalmazza, hogy áttekinthesse a metrikák eredményeit:

Az összes bináris besorolási modellhez egységes metrikákat használunk.
A pontosság az összes többosztályos besorolási modellhez használatos.
A regressziós modellekhez különböző metrikákat használunk.

A betanítás során azonban egyetlen metrikát kell választania a hangolási folyamat során létrehozott modellek rangsorolásához. Előfordulhat, hogy a legjobb metrika az üzleti problémától, valamint a hamis pozitív és hamis negatív értékek költségétől függően változik.

Bináris besoroláshoz használt metrikák

A pontosság a valós eredmények aránya az összes esethez.
A pontosság a valódi eredmények és a pozitív eredmények aránya.
A visszahívás az összes helyes eredmény töredéke az összes eredményhez képest.
Az F-pontszám olyan mérték, amely kiegyensúlyozást biztosít a pontosság és a visszahívás között.
Az AUC egy érték, amely a görbe alatti területet jelöli, amikor a hamis pozitívok az x tengelyen vannak ábrázolva, és a valódi pozitívok az y tengelyen vannak ábrázolva.
Az átlagos naplóvesztés két valószínűségeloszlás különbsége: a valódi és a modellben lévő.

Regresszióhoz használt metrikák

Az átlagos abszolút hiba a modell összes hibáját átlagolja, ahol a hiba az előrejelzett érték távolságát jelenti a valódi értéktől. Gyakran MAE néven rövidítve.
A középszintű négyzetes hiba gyökere a hibák négyzeteinek átlagát méri, majd ennek az értéknek a gyökerét veszi fel. Gyakran RMSE néven rövidítve.
A relatív abszolút hiba a hibát a valódi érték százalékában jelöli.
A relatív négyzetes hiba normalizálja a teljes négyzetes hibát úgy, hogy elosztja az előrejelzett értékek teljes négyzetes hibájával.
A meghatározási együttható egyetlen szám, amely azt jelzi, hogy az adatok mennyire illenek a modellhez. Az egyik érték azt jelenti, hogy a modell pontosan megfelel az adatoknak. A nulla érték azt jelenti, hogy az adatok véletlenszerűek, vagy más módon nem felelnek meg a modellnek. Ezt gyakran r², R² vagy r-négyzetnek is nevezik.

A paraméteres takarítást nem támogató összetevők

Az Azure Machine Learning szinte minden tanulója támogatja a keresztérvényesítést egy integrált paraméteres takarítással, amellyel kiválaszthatja a folyamathoz tartozó paramétereket. Ha a tanuló nem támogatja egy értéktartomány beállítását, akkor is használhatja keresztérvényesítéshez. Ebben az esetben az engedélyezett értékek tartománya lesz kiválasztva a takarításhoz.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .

Megosztás a következőn keresztül: