Megosztás a következőn keresztül:


Lineáris regressziós összetevő

Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.

Ezzel az összetevővel lineáris regressziós modellt hozhat létre a folyamatokban való használathoz. Lineáris regressziós kísérlet egy vagy több független változó és egy numerikus eredmény vagy függő változó közötti lineáris kapcsolat létrehozására.

Ezzel az összetevővel definiálhat egy lineáris regressziós módszert, majd betanított egy modellt egy címkézett adatkészlet használatával. A betanított modell ezután előrejelzések készítésére használható.

A lineáris regresszió ismertetése

A lineáris regresszió egy gyakori statisztikai módszer, amelyet a gépi tanulásban alkalmazunk, és számos új módszerrel bővítjük a vonal illesztése és a hiba mérése céljából. Egyszerűen fogalmazva, a regresszió numerikus cél előrejelzésére utal. A lineáris regresszió akkor is jó választás, ha egyszerű modellt szeretne egy egyszerű prediktív feladathoz. A lineáris regresszió általában jól működik a nagy dimenziójú, ritka adathalmazokon, amelyek összetettsége hiányzik.

Az Azure Machine Learning számos regressziós modellt támogat a lineáris regresszió mellett. A "regresszió" kifejezés azonban lazán értelmezhető, és a más eszközökben biztosított regresszió egyes típusai nem támogatottak.

  • A klasszikus regressziós probléma egyetlen független változót és egy függő változót foglal magában. Ezt egyszerű regressziónak nevezzük. Ez az összetevő támogatja az egyszerű regressziót.

  • A többszörös lineáris regresszió két vagy több független változót foglal magában, amelyek egyetlen függő változóhoz járulnak hozzá. Többváltozós lineáris regressziónak is nevezik azokat a problémákat, amelyekben több bemenetet használnak egyetlen numerikus eredmény előrejelzéséhez.

    A lineáris regressziós összetevő képes megoldani ezeket a problémákat, ahogy a többi regressziós összetevő is.

  • A többcímkés regresszió egy modellen belül több függő változó előrejelzésének feladata. A többcímkés logisztikai regresszióban például egy minta több különböző címkéhez rendelhető. (Ez eltér attól a feladattól, amely több szintet jelez előre egyetlen osztályváltozón belül.)

    Ez a regressziótípus nem támogatott az Azure Machine Learningben. Több változó előrejelzéséhez hozzon létre egy külön tanulót minden előrejelezni kívánt kimenethez.

A statisztikusok évek óta egyre fejlettebb regressziós módszereket fejlesztenek. Ez a lineáris regresszióra is igaz. Ez az összetevő két módszert támogat a hiba mérésére és a regressziós egyenes illesztésére: a szokásos legkisebb négyzetek módszerét és a gradiens ereszkedést.

  • A színátmenetes lejtés egy olyan módszer, amely minimalizálja a hiba mennyiségét a modell betanítási folyamatának minden egyes lépésében. A gradiens ereszkedésnek számos változata létezik, és a különböző tanulási problémákra való optimalizálását alaposan tanulmányozták. Ha ezt a megoldást választja a Megoldás módszerhez, számos paramétert állíthat be a lépésméret, a tanulási sebesség és így tovább szabályozásához. Ez a lehetőség az integrált paraméteres takarítás használatát is támogatja.

  • A normál legkisebb négyzetek a lineáris regresszió egyik leggyakrabban használt technikája. A legkisebb négyzet például a Microsoft Excel Analysis Toolpak-ban használt módszer.

    A normál legkisebb négyzetek a veszteségfüggvényre utalnak, amely a hibát a tényleges értéktől az előrejelzett egyenesig megtett távolság négyzetének összegeként számítja ki, és a négyzetes hiba minimalizálásával illeszkedik a modellhez. Ez a módszer erős lineáris kapcsolatot feltételez a bemenetek és a függő változó között.

Lineáris regresszió konfigurálása

Ez az összetevő két módszert támogat a regressziós modell illesztéshez, különböző lehetőségekkel:

Regressziós modell létrehozása normál legkisebb négyzetek használatával

  1. Adja hozzá a lineáris regressziós modell összetevőt a folyamathoz a tervezőben.

    Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Modell inicializálása, majd a Regresszió csomópontot, majd húzza a Lineáris regressziós modell összetevőt a folyamatba.

  2. A Tulajdonságok panel Megoldásmetódus legördülő listájában válassza a Szokásos legkisebb négyzetek elemet. Ez a beállítás határozza meg a regressziós egyenes megkereséséhez használt számítási módszert.

  3. Az L2-reginálási súly mezőbe írja be az L2-regináláshoz súlyként használni kívánt értéket. Javasoljuk, hogy a túlillesztés elkerülése érdekében ne használjon nulla értéket.

    Ha többet szeretne megtudni arról, hogy a rendszeresítés hogyan befolyásolja a modell illesztését, tekintse meg ezt a cikket: L1 és L2 Regularization for Machine Learning

  4. Válassza a Metszet kifejezés belefoglalása lehetőséget, ha meg szeretné tekinteni az metszéspont kifejezését.

    Ha nem kell áttekintenie a regressziós képletet, törölje a beállítás kijelölését.

  5. Véletlenszerű számmagok esetén megadhat egy értéket, amellyel a modell által használt véletlenszerű számgenerátort vetheti be.

    A kezdőérték használata akkor hasznos, ha ugyanazon folyamat különböző futtatásaiban ugyanazokat az eredményeket szeretné megőrizni. Ellenkező esetben az alapértelmezett érték a rendszerórából származik.

  6. Adja hozzá a Modell betanítása összetevőt a folyamathoz, és csatlakoztassa a címkézett adatkészletet.

  7. Küldje el a folyamatot.

A szokásos legkisebb négyzetek modell eredményei

A betanítás befejezése után:

  • Előrejelzések készítéséhez csatlakoztassa a betanított modellt a Modell pontozása összetevőhöz, valamint egy új értékekből álló adatkészletet.

Regressziós modell létrehozása online gradiens módszer használatával

  1. Adja hozzá a lineáris regressziós modell összetevőt a folyamathoz a tervezőben.

    Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Modell inicializálása, a Regresszió csomópontot, és húzza a Lineáris regressziós modell összetevőt a folyamatba

  2. A Tulajdonságok panel Megoldásmetódus legördülő listájában válassza az Online színátmenetes módszer lehetőséget a regressziós egyenes megkereséséhez használt számítási módszerként.

  3. Az Oktató létrehozása módnál adja meg, hogy előre meghatározott paraméterekkel szeretné-e betaníteni a modellt, vagy paraméteres takarítással szeretné optimalizálni a modellt.

    • Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a lineáris regressziós hálózatot, argumentumként megadhat egy adott értékkészletet.

    • Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és paraméteres takarítást szeretne futtatni. Válasszon ki egy értéktartományt, amelyet újra kell iterálni, és a Modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját végigterjedve határozza meg az optimális eredményt eredményező hiperparamétereket.

  4. A Tanulási sebesség beállításnál adja meg a sztochasztikus gradiens ereszkedés-optimalizáló kezdeti tanulási sebességét.

  5. A Betanítási alapidőszakok száma mezőbe írjon be egy értéket, amely azt jelzi, hogy az algoritmusnak hányszor kell iterálnia példákon keresztül. A kis számú példával rendelkező adathalmazok esetében ennek a számnak nagynak kell lennie a konvergencia eléréséhez.

  6. Szolgáltatások normalizálása: Ha már normalizálta a modell betanításához használt numerikus adatokat, megszüntetheti a beállítás kijelölését. Alapértelmezés szerint az összetevő normalizálja az összes numerikus bemenetet egy 0 és 1 közötti tartományba.

    Megjegyzés

    Ne felejtse el ugyanazt a normalizálási módszert alkalmazni a pontozáshoz használt új adatokra.

  7. Az L2-reginálási súly mezőbe írja be az L2-regináláshoz súlyként használni kívánt értéket. Javasoljuk, hogy a túlillesztés elkerülése érdekében ne használjon nulla értéket.

    Ha többet szeretne megtudni arról, hogy a rendszeresítés hogyan befolyásolja a modell illesztését, tekintse meg ezt a cikket: L1 és L2 Regularization for Machine Learning

  8. Válassza a Tanulási sebesség csökkentése lehetőséget, ha azt szeretné, hogy a tanulási sebesség csökkenjen az iterációk előrehaladása során.

  9. Véletlenszerű számmagok esetén megadhat egy értéket, amellyel a modell által használt véletlenszerű számgenerátort vetheti be. A kezdőérték használata akkor hasznos, ha ugyanazon folyamat különböző futtatásaiban ugyanazokat az eredményeket szeretné megőrizni.

  10. A modell betanítása:

    Megjegyzés

    Ha paramétertartományt ad át a Modell betanítása szolgáltatásnak, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

    Ha egyetlen paraméterérték-készletet ad át a Modell hiperparamétereinek finomhangolása összetevőnek, amikor az minden paraméterhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

    Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az adott értéket használja a takarítás során, még akkor is, ha más paraméterek egy értéktartományon belül változnak.

  11. Küldje el a folyamatot.

Online színátmenetes módszer eredményei

A betanítás befejezése után:

  • Előrejelzések készítéséhez csatlakoztassa a betanított modellt a Modell pontozása összetevőhöz az új bemeneti adatokkal együtt.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .