Lineáris regressziós összetevő

2024-09-01

Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.

Ezzel az összetevővel lineáris regressziós modellt hozhat létre egy folyamatban való használatra. Lineáris regressziós kísérletek lineáris kapcsolat létrehozására egy vagy több független változó és egy numerikus eredmény vagy függő változó között.

Ezzel az összetevővel lineáris regressziós metódust definiálhat, majd egy címkézett adatkészlet használatával betanított egy modellt. A betanított modell ezután használható előrejelzések készítésére.

A lineáris regresszió ismertetése

A lineáris regresszió egy gyakori statisztikai módszer, amelyet a gépi tanulásban alkalmaztak, és számos új módszerrel egészítik ki a vonal illesztési és mérési hibáit. Egyszerűen fogalmazva a regresszió numerikus cél előrejelzésére utal. A lineáris regresszió akkor is jó választás, ha egyszerű modellt szeretne egy egyszerű prediktív feladathoz. A lineáris regresszió általában jól működik a nagy méretű, ritkán összetett adathalmazokon is.

Az Azure Machine Learning számos regressziós modellt támogat a lineáris regresszió mellett. A "regresszió" kifejezés azonban lazán értelmezhető, és a más eszközökben biztosított regresszió bizonyos típusai nem támogatottak.

A klasszikus regressziós probléma egyetlen független változót és függő változót foglal magában. Ezt egyszerű regressziónak nevezzük. Ez az összetevő támogatja az egyszerű regressziót.
A több lineáris regresszió két vagy több független változót foglal magában, amelyek egyetlen függő változóhoz járulnak hozzá. Azokat a problémákat, amelyekben több bemenetet használnak egyetlen numerikus eredmény előrejelzéséhez, többváltozós lineáris regressziónak is nevezzük.

A lineáris regressziós összetevő képes megoldani ezeket a problémákat, ahogy a többi regressziós összetevő is.
A többcímkés regresszió egy modellben több függő változó előrejelzésének feladata. A többcímkes logisztikai regresszióban például egy minta több különböző címkéhez rendelhető. (Ez különbözik attól a feladattól, amely több szintet jelez előre egy osztályváltozón belül.)

Ez a regressziótípus nem támogatott az Azure Machine Learningben. Több változó előrejelzéséhez hozzon létre egy külön tanulót minden előrejelezni kívánt kimenethez.

A statisztikusok évek óta egyre fejlettebb regressziós módszereket fejlesztenek. Ez még a lineáris regresszióra is igaz. Ez az összetevő két módszert támogat a hiba mérésére és a regressziós vonal illesztésére: a szokásos legkisebb négyzetes metódust és a színátmenetes süllyedést.

A színátmenetes süllyedés egy olyan módszer, amely minimálisra csökkenti a hiba mennyiségét a modell betanítási folyamatának minden egyes lépésében. A gradiens leereszkedésnek számos változata létezik, és a különböző tanulási problémák optimalizálása széles körben tanulmányozva van. Ha ezt a megoldást választja a Megoldás módszerhez, számos paramétert állíthat be a lépésméret, a tanulási sebesség stb. szabályozásához. Ez a lehetőség támogatja az integrált paraméter-takarítás használatát is.
A normál legkisebb négyzetek a lineáris regresszió egyik leggyakrabban használt technikája. A legkisebb négyzet például a Microsoft Excel Analysis Toolpak-ban használt metódusa.

A szokásos legkisebb négyzetek a veszteségfüggvényre utalnak, amely a hibát a tényleges értéktől az előrejelzett vonalig mért távolság négyzetének összegeként számítja ki, és a négyzetes hiba minimalizálásával illeszkedik a modellhez. Ez a módszer erős lineáris kapcsolatot feltételez a bemenetek és a függő változó között.

Lineáris regresszió konfigurálása

Ez az összetevő két módszert támogat egy regressziós modell illesztéshez, különböző lehetőségekkel:

Regressziós modell illesztése normál legkisebb négyzetekkel

Kis adathalmazok esetén a legjobb, ha a szokásos legkisebb négyzeteket választja ki. Ennek hasonló eredményt kell adnia az Excelhez.
Regressziós modell létrehozása online színátmenetes süllyedés használatával

A színátmenetes süllyedés jobb veszteségfüggvény az összetettebb modelleknél, vagy túl kevés betanítási adat van a változók száma miatt.

Regressziós modell létrehozása szokásos legkisebb négyzetekkel

Adja hozzá a lineáris regressziós modell összetevőt a folyamathoz a tervezőben.

Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Modell inicializálása, a Regresszió kibontása elemet, majd húzza a lineáris regressziós modell összetevőt a folyamatba.
A Tulajdonságok panel Megoldás módszer legördülő listájában válassza a Szokásos legkisebb négyzetek lehetőséget. Ez a beállítás a regressziós sor megkereséséhez használt számítási módszert adja meg.
Az L2-reginálási súlyban írja be az L2-regináláshoz súlyként használni kívánt értéket. Javasoljuk, hogy a túlillesztés elkerülése érdekében ne használjon nulla értéket.

Ha többet szeretne megtudni arról, hogy a rendszeresítés hogyan befolyásolja a modellillesztéseket, tekintse meg ezt a cikket: L1 és L2 A Machine Learning-hez való rendszeresítés
Ha meg szeretné tekinteni az elfogás kifejezését, válassza az Elfogó kifejezés belefoglalása lehetőséget.

Ha nem kell áttekintenie a regressziós képletet, törölje a kijelölést.
Véletlenszerű számvetés esetén megadhat egy értéket, amellyel a modell által használt véletlenszerű számgenerátort vetheti be.

A kezdőérték használata akkor hasznos, ha ugyanazokat az eredményeket szeretné fenntartani ugyanazon folyamat különböző futtatásaiban. Ellenkező esetben az alapértelmezett érték a rendszerórából származó érték használata.
Adja hozzá a Modell betanítása összetevőt a folyamathoz, és csatlakoztassa a címkézett adatkészletet.
Küldje el a folyamatot.

A szokásos legkisebb négyzetek modell eredményei

A betanítás befejezése után:

Előrejelzések készítéséhez csatlakoztassa a betanított modellt a Score Model összetevőhöz, valamint egy új értékekből álló adatkészletet.

Regressziós modell létrehozása online színátmenetes süllyedés használatával

Adja hozzá a lineáris regressziós modell összetevőt a folyamathoz a tervezőben.

Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Modell inicializálása, a Regresszió kibontása, majd a Lineáris regressziós modell összetevő húzása a folyamatba
A Tulajdonságok panel Megoldás módszer legördülő listájában válassza az Online színátmenetes süllyedés lehetőséget a regressziós vonal megkereséséhez használt számítási módszerként.
A Kiképző létrehozása mód esetében adja meg, hogy előre meghatározott paraméterekkel szeretné-e betaníteni a modellt, vagy egy paramétersepréssel szeretné optimalizálni a modellt.
- Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a lineáris regressziós hálózatot, megadhat egy adott értékkészletet argumentumként.
- Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és szeretne paraméter-takarítást futtatni. Válasszon ki egy iterátumhoz szükséges értéktartományt, és a modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját átszűri az optimális eredményt eredményező hiperparaméterek meghatározásához.
A tanulási sebességhez adja meg a sztochasztikus gradiens süllyedési optimalizáló kezdeti tanulási sebességét.
A Betanítási időszakok száma mezőben írjon be egy értéket, amely jelzi, hogy az algoritmusnak hányszor kell iterálnia példákon keresztül. A kis számú példával rendelkező adathalmazok esetében ennek a számnak nagynak kell lennie a konvergenciához.
Funkciók normalizálása: Ha már normalizálta a modell betanításához használt numerikus adatokat, törölheti ezt a beállítást. Az összetevő alapértelmezés szerint 0 és 1 közötti tartományba normalizálja az összes numerikus bemenetet.

Feljegyzés

Ne feledje ugyanazt a normalizálási módszert alkalmazni a pontozáshoz használt új adatokra.
Az L2-reginálási súlyban írja be az L2-regináláshoz súlyként használni kívánt értéket. Javasoljuk, hogy a túlillesztés elkerülése érdekében ne használjon nulla értéket.

Ha többet szeretne megtudni arról, hogy a rendszeresítés hogyan befolyásolja a modellillesztéseket, tekintse meg ezt a cikket: L1 és L2 A Machine Learning-hez való rendszeresítés
Ha azt szeretné, hogy a tanulási sebesség az iterációk előrehaladása során csökkenjen, válassza a "Tanulási sebesség csökkentése" lehetőséget.
Véletlenszerű számvetés esetén megadhat egy értéket, amellyel a modell által használt véletlenszerű számgenerátort vetheti be. A kezdőérték használata akkor hasznos, ha ugyanazokat az eredményeket szeretné fenntartani ugyanazon folyamat különböző futtatásaiban.
A modell betanítása:
- Ha a Kiképző létrehozása módot egyetlen paraméterre állítja, csatlakoztassa a címkézett adatkészletet és a Modell betanítása összetevőt.
- Ha paramétertartományra állítja a Kiképző létrehozása módot, csatlakoztassa a címkézett adatkészletet, és betanítsa a modellt a modell hiperparamétereinek finomhangolásával.
Feljegyzés

Ha paramétertartományt ad át a modell betanítása gombra, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

Ha egyetlen paraméterértéket ad át a Modell hiperparaméterek hangolása összetevőnek, amikor az egyes paraméterekhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer a takarítás során az ön által megadott egyetlen értéket használja, még akkor is, ha más paraméterek egy értéktartományon belül változnak.
Küldje el a folyamatot.

Online színátmenetes süllyedés eredményei

A betanítás befejezése után:

Előrejelzések készítéséhez csatlakoztassa a betanított modellt a Score Model összetevőhöz az új bemeneti adatokkal együtt.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket.