Megosztás a következőn keresztül:


Kétosztályos támogató vektorgép

Bináris besorolási modellt hoz létre a támogatóvektor-gép algoritmusával

Kategória: Machine Learning / Modell inicializálása / Besorolás

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio (klasszikus) kétosztályos támogatóvektor-gép modulja egy olyan modell létrehozásához, amely a támogatóvektor-gépi algoritmuson alapul.

A támogatóvektor-gépek (TÁMOGATÓvektor-gépek) a felügyelt tanulási módszerek jól áttanult osztályai. Ez az implementáció két lehetséges eredmény folyamatos vagy kategorikus változók alapján való előrejelzéséhez alkalmas.

A modellparaméterek meghatározása után betanítja a modellt az egyik betanító modullal, és biztosít egy címkével ellátott adatkészletet, amely tartalmaz egy címkét vagy egy eredményoszlopot.

További információ a támogatóvektor-gépekről

A támogatóvektor-gépek a gépi tanulási algoritmusok közül a legkorábbiak, és az SVM-modelleket számos alkalmazásban használták az információ lekéréstől a szöveg- és képbesorolásig. Az SVM-eket besorolási és regressziós feladatokhoz is lehet használni.

Ez az SVM-modell egy felügyelt tanulási modell, amely címkével jelölt adatokat igényel. A betanítási folyamat során az algoritmus elemzi a bemeneti adatokat, és felismeri a mintákat egy hipersík nevű többdimenziós jellemzőtérben. Minden bemeneti példa pontokként van ábrázolva ezen a térben, és úgy van leképezve a kimeneti kategóriákra, hogy a kategóriák a lehető legszélesebbre legyenek osztva, és a lehető legnagyobb eltérés legyen látható.

Az előrejelzéshez az SVM-algoritmus új példákat rendel az egyik vagy a másik kategóriához, és leképezi őket ugyanerre a térre.

A támogatóvektorTwo-Class gép konfigurálása

Ehhez a modelltípushoz javasoljuk, hogy normalizálja az adatkészletet, mielőtt betanítja az osztályozót.

  1. Adja hozzá a kétosztályos támogató vektorgép modult a (klasszikus) Studióban található kísérlethez.

  2. Az Oktatói mód létrehozása beállítással adhatja meg, hogyan szeretné betanítni a modellt.

    • Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként egy adott értékkészletet is meg lehet adni.

    • Paramétertartomány: Ha nem biztos a legjobb paraméterekben, több érték megadásával és a Modell hiperparaméterek hangolása modullal megkeresheti az optimális konfigurációt. Az edző a beállítások több kombinációján iterál, és meghatározza a legjobb modellt előállító értékek kombinációját.

  3. Az Iterációk száma mezőbe írjon be egy számot, amely a modell létrehozásakor használt iterációk számát jelöli.

    Ezzel a paraméterrel szabályozható a betanítási sebesség és a pontosság közötti különbség.

  4. A Lambda mezőben adjon meg egy értéket, amely az L1 regularizáció súlyozásához lesz használva.

    Ezzel a regularizációs együtthatóval finomhangolhatja a modellt. A nagyobb értékek összetettebb modelleket tartalmaznak.

  5. Válassza a Funkciók normalizálása lehetőséget, ha a betanítás előtt normalizálni szeretné a jellemzőket.

    Ha normalizálást alkalmaz, a betanítás előtt az adatpontok középre vannak pontosodva, és egy egység szórással vannak skálázva.

  6. Az együtthatók normalizálása Project az egység sphere-hez való kijelölést.

    Az értékek egységtérbe való kivetítéskor a betanítás előtt az adatpontok 0-ra vannak központosodva, és úgy vannak méretve, hogy egy egység szórást tartalmaznak.

  7. A Véletlenszám-kezdőérték mezőbe írjon be egy egész számot, amely kezdőértékként lesz használva, ha a futtatások reprodukálhatóságát szeretné biztosítani. Ellenkező esetben a rendszeróra értéket használ kezdőértékként, ami kismértékben eltérő eredményeket eredményezhet a futtatáskor.

  8. Válassza az Ismeretlen kategória engedélyezése lehetőséget, hogy létrehoz egy csoportot az ismeretlen értékekhez a betanítás vagy az ellenőrzési készletben. Ebben az esetben a modell kevésbé lesz pontos az ismert értékekhez, de jobb előrejelzéseket nyújthat az új (ismeretlen) értékekről.

    Ha be nemútja a kijelölését, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni.

  9. Csatlakozás egy címkével jelölt adatkészletet és az egyik betanító modult:

    Megjegyzés

    Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket fogja használni a paramétertartományok listájában.

    Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és a tanuló alapértelmezett értékeit használja.

    Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az Ön által megadott egyetlen értéket fogja használni a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.

  10. Futtassa a kísérletet.

Results (Eredmények)

A betanítás befejezése után:

  • A modell paramétereinek összegzését és a betanítás során megtanult jellemzősúlyokat a jobb gombbal a Train Model (Modell betanítása) vagy a Tune Model Hyperparameters (Modell hiperparaméterek hangolása) kimenetére kattintva, majd a Visualize (Képi megjelenítés) lehetőséget választva láthatja.

  • Ha a betanított modelleket előrejelzésekhez szeretne használni, csatlakoztassa a betanított modellt a Score Model (Modell pontozása) modulhoz .

  • Ha keresztellenőrzést szeretne végrehajtani egy címkézett adatkészleten, csatlakoztassa a nem képezett modellt és az adatkészletet a Modell keresztellenőrzése hez.

Példák

A tanulási algoritmus használatára vonatkozó példákért lásd a Azure AI Gallery:

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.

Használati tippek

Ehhez a modelltípushoz javasoljuk, hogy normalizálja az adatkészletet, mielőtt betanítja az osztályozót.

Bár a közelmúltban végzett kutatások nagyobb pontosságú algoritmusokat fejlesztettek ki, ez az algoritmus jól működik egyszerű adatkészletekkel, ha a cél a pontosságnál gyorsabb. Ha a kétosztályos támogatóvektor-modell nem a kívánt eredményt használja, próbálkozzon az alábbi besorolási módszerek egyikével:

Modulparaméterek

Name Tartomány Típus Alapértelmezett Description
Iterációk száma >=1 Egész szám 1 Az iterációk száma
Lambda >=double. Epsilon Float 0,001 Súlyozás az L1 regularizáláshoz. A nem nulla érték használatával elkerülhető, hogy a modell túlilles legyen a betanítás adatkészletéhez.
Funkciók normalizálása Bármelyik Logikai Igaz Ha igaz, normalizálja a funkciókat.
Project az egység-sphere-hez Bármelyik Logikai Hamis Ha igaz, kivetíti a jellemzőket egy egységkörre.
Véletlenszerű szám kezdőszáma Bármelyik Egész szám A modell által használt véletlenszám-generátor kezdő magja. Hagyja üresen az alapértelmezett értéket.
Ismeretlen kategorikus szintek engedélyezése Bármelyik Logikai Igaz Ha igaz, a minden kategorikus oszlophoz létrehoz egy további szintet. A tesztadatkészletnek a betanítás adatkészletében nem elérhető szintjei erre a további szintre vannak leképezve.

Kimenet

Név Típus Description
Nem korlátozott modell Adattábla Nem korlátozott bináris besorolási modell.

Lásd még

Osztályozás
A–Z modullista