Kétosztályos támogató vektorgép
Bináris besorolási modellt hoz létre a támogatóvektor-gép algoritmusával
Kategória: Machine Learning / Modell inicializálása / Besorolás
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio (klasszikus) kétosztályos támogatóvektor-gép modulja egy olyan modell létrehozásához, amely a támogatóvektor-gépi algoritmuson alapul.
A támogatóvektor-gépek (TÁMOGATÓvektor-gépek) a felügyelt tanulási módszerek jól áttanult osztályai. Ez az implementáció két lehetséges eredmény folyamatos vagy kategorikus változók alapján való előrejelzéséhez alkalmas.
A modellparaméterek meghatározása után betanítja a modellt az egyik betanító modullal, és biztosít egy címkével ellátott adatkészletet, amely tartalmaz egy címkét vagy egy eredményoszlopot.
További információ a támogatóvektor-gépekről
A támogatóvektor-gépek a gépi tanulási algoritmusok közül a legkorábbiak, és az SVM-modelleket számos alkalmazásban használták az információ lekéréstől a szöveg- és képbesorolásig. Az SVM-eket besorolási és regressziós feladatokhoz is lehet használni.
Ez az SVM-modell egy felügyelt tanulási modell, amely címkével jelölt adatokat igényel. A betanítási folyamat során az algoritmus elemzi a bemeneti adatokat, és felismeri a mintákat egy hipersík nevű többdimenziós jellemzőtérben. Minden bemeneti példa pontokként van ábrázolva ezen a térben, és úgy van leképezve a kimeneti kategóriákra, hogy a kategóriák a lehető legszélesebbre legyenek osztva, és a lehető legnagyobb eltérés legyen látható.
Az előrejelzéshez az SVM-algoritmus új példákat rendel az egyik vagy a másik kategóriához, és leképezi őket ugyanerre a térre.
A támogatóvektorTwo-Class gép konfigurálása
Ehhez a modelltípushoz javasoljuk, hogy normalizálja az adatkészletet, mielőtt betanítja az osztályozót.
Adja hozzá a kétosztályos támogató vektorgép modult a (klasszikus) Studióban található kísérlethez.
Az Oktatói mód létrehozása beállítással adhatja meg, hogyan szeretné betanítni a modellt.
Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként egy adott értékkészletet is meg lehet adni.
Paramétertartomány: Ha nem biztos a legjobb paraméterekben, több érték megadásával és a Modell hiperparaméterek hangolása modullal megkeresheti az optimális konfigurációt. Az edző a beállítások több kombinációján iterál, és meghatározza a legjobb modellt előállító értékek kombinációját.
Az Iterációk száma mezőbe írjon be egy számot, amely a modell létrehozásakor használt iterációk számát jelöli.
Ezzel a paraméterrel szabályozható a betanítási sebesség és a pontosság közötti különbség.
A Lambda mezőben adjon meg egy értéket, amely az L1 regularizáció súlyozásához lesz használva.
Ezzel a regularizációs együtthatóval finomhangolhatja a modellt. A nagyobb értékek összetettebb modelleket tartalmaznak.
Válassza a Funkciók normalizálása lehetőséget, ha a betanítás előtt normalizálni szeretné a jellemzőket.
Ha normalizálást alkalmaz, a betanítás előtt az adatpontok középre vannak pontosodva, és egy egység szórással vannak skálázva.
Az együtthatók normalizálása Project az egység sphere-hez való kijelölést.
Az értékek egységtérbe való kivetítéskor a betanítás előtt az adatpontok 0-ra vannak központosodva, és úgy vannak méretve, hogy egy egység szórást tartalmaznak.
A Véletlenszám-kezdőérték mezőbe írjon be egy egész számot, amely kezdőértékként lesz használva, ha a futtatások reprodukálhatóságát szeretné biztosítani. Ellenkező esetben a rendszeróra értéket használ kezdőértékként, ami kismértékben eltérő eredményeket eredményezhet a futtatáskor.
Válassza az Ismeretlen kategória engedélyezése lehetőséget, hogy létrehoz egy csoportot az ismeretlen értékekhez a betanítás vagy az ellenőrzési készletben. Ebben az esetben a modell kevésbé lesz pontos az ismert értékekhez, de jobb előrejelzéseket nyújthat az új (ismeretlen) értékekről.
Ha be nemútja a kijelölését, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni.
Csatlakozás egy címkével jelölt adatkészletet és az egyik betanító modult:
Ha a Create trainer mode (Oktatói mód létrehozása)paramétert Single Parameter (Egyparaméteres) beállításra beállította, használja a Train Model (Modell betanítása) modult .
Ha a Create trainer mode (Oktató létrehozása)paramétertartományt adja meg, használja a Modell hiperparaméterek hangolása gombra.
Megjegyzés
Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket fogja használni a paramétertartományok listájában.
Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és a tanuló alapértelmezett értékeit használja.
Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az Ön által megadott egyetlen értéket fogja használni a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.
Futtassa a kísérletet.
Results (Eredmények)
A betanítás befejezése után:
A modell paramétereinek összegzését és a betanítás során megtanult jellemzősúlyokat a jobb gombbal a Train Model (Modell betanítása) vagy a Tune Model Hyperparameters (Modell hiperparaméterek hangolása) kimenetére kattintva, majd a Visualize (Képi megjelenítés) lehetőséget választva láthatja.
Ha a betanított modelleket előrejelzésekhez szeretne használni, csatlakoztassa a betanított modellt a Score Model (Modell pontozása) modulhoz .
Ha keresztellenőrzést szeretne végrehajtani egy címkézett adatkészleten, csatlakoztassa a nem képezett modellt és az adatkészletet a Modell keresztellenőrzése hez.
Példák
A tanulási algoritmus használatára vonatkozó példákért lásd a Azure AI Gallery:
Közvetlen marketing: SVM-modellel osztályozza az ügyfeleket a megfelelőség alapján.
Hitelkockázat előrejelzése: SVM-et használ a hitelkockázat értékeléséhez.
Többosztályos osztályozók összehasonlítása:SVM-modellt használ kézírás-felismeréshez.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.
Használati tippek
Ehhez a modelltípushoz javasoljuk, hogy normalizálja az adatkészletet, mielőtt betanítja az osztályozót.
Bár a közelmúltban végzett kutatások nagyobb pontosságú algoritmusokat fejlesztettek ki, ez az algoritmus jól működik egyszerű adatkészletekkel, ha a cél a pontosságnál gyorsabb. Ha a kétosztályos támogatóvektor-modell nem a kívánt eredményt használja, próbálkozzon az alábbi besorolási módszerek egyikével:
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Iterációk száma | >=1 | Egész szám | 1 | Az iterációk száma |
Lambda | >=double. Epsilon | Float | 0,001 | Súlyozás az L1 regularizáláshoz. A nem nulla érték használatával elkerülhető, hogy a modell túlilles legyen a betanítás adatkészletéhez. |
Funkciók normalizálása | Bármelyik | Logikai | Igaz | Ha igaz, normalizálja a funkciókat. |
Project az egység-sphere-hez | Bármelyik | Logikai | Hamis | Ha igaz, kivetíti a jellemzőket egy egységkörre. |
Véletlenszerű szám kezdőszáma | Bármelyik | Egész szám | A modell által használt véletlenszám-generátor kezdő magja. Hagyja üresen az alapértelmezett értéket. | |
Ismeretlen kategorikus szintek engedélyezése | Bármelyik | Logikai | Igaz | Ha igaz, a minden kategorikus oszlophoz létrehoz egy további szintet. A tesztadatkészletnek a betanítás adatkészletében nem elérhető szintjei erre a további szintre vannak leképezve. |
Kimenet
Név | Típus | Description |
---|---|---|
Nem korlátozott modell | Adattábla | Nem korlátozott bináris besorolási modell. |