Two-Class Bayes Point Machine

Cikk
03/05/2020

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Létrehoz egy Bayes-pont gép bináris besorolási modelljét

Kategória: Machine Learning / Modell inicializálása / Besorolás

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio kétosztályos Bayes Point Machine modulja egy nem korlátozott bináris besorolási modell létrehozásához.

Ebben a modulban az algoritmus egy Bayes-módszert használ a lineáris besoroláshoz, az úgynevezett "Bayes Point Machine". Ez az algoritmus hatékonyan közelíti meg a lineáris osztályozók elméletileg optimális Bayes-átlagát (az általánosítási teljesítmény szempontjából), egy "átlag" osztályozó, a Bayes-pont kiválasztásával. Mivel a Bayes Point Machine egy Bayes-osztályozási modell, nem lehet túlilledni a betanítás adataihoz.

További információkért tekintse meg Chris Fogo bejegyzését a Microsoft Machine Learning blogján: Embracing Uncertainty - Probabilistic Inference ..

Az Two-Class Bayes Point Machine konfigurálása

A Machine Learning Studióban (klasszikus) adja hozzá a kétosztályos Bayes Point Machine modult a kísérlethez. A modult a modell inicializálása és Machine Learningszakaszbantalálja.
A Number of training iterations (Betanítási iterációk száma) mezőbe írjon be egy számot annak megadásához, hogy az üzenetát átadási algoritmus milyen gyakran iterál a betanítási adatokon. Az iterációk számát általában az 5–100 tartományban kell beállítani.

Minél nagyobb a betanítási iterációk száma, annál pontosabbak az előrejelzések; A betanítás azonban lassabb lesz.

A legtöbb adatkészlet esetén a 30 betanítási iteráció alapértelmezett beállítása elegendő ahhoz, hogy az algoritmus pontos előrejelzéseket biztosítson. Néha kevesebb iterációval lehet pontos előrejelzéseket tenni. A nagy mértékben korrelált funkciókkal rendelkezik adatkészletek esetén több betanítási iterációt érdemes lehet kihozni.
Válassza az Elfogultság is lehetőséget, ha állandó jellemzőt vagy torzítást szeretne hozzáadni az egyes példányhoz a betanítás és az előrejelzés során.

Torzításra akkor van szükség, ha az adatok még nem tartalmaznak állandó jellemzőt.
Válassza az Ismeretlen értékek engedélyezése kategorikus jellemzőkben lehetőséget, hogy létrehoz egy csoportot ismeretlen értékekhez.

Ha nem választja ki ezt a beállítást, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni.

Ha ezt a lehetőséget választja, és engedélyezi az ismeretlen értékeket, előfordulhat, hogy a modell kevésbé lesz pontos az ismert értékekhez, de jobb előrejelzéseket biztosít az új (ismeretlen) értékekhez.
Adja hozzá a Modell betanítása modul egy példányát és a betanítás adatait.
Csatlakozás a Kétosztályos Bayes-pont gép modul betanítására és kimenetére vonatkozó adatokat a Modell betanítása modulhoz, majd válassza ki a címkeoszlopot.
Futtassa a kísérletet.

Results (Eredmények)

A betanítás befejezése után kattintson a jobb gombbal a Train Model (Modell betanítása) modul kimenetére az eredmények megtekintéséhez:

A modell paramétereinek összegzését és a betanítás során megtanult jellemzősúlyokat a Vizualizáció lehetőséget választva láthatja.
A modell későbbi használatra való mentéshez kattintson a jobb gombbal a Train MOdel (MOdel betanítás) kimenetére, majd válassza a Save as Trained Model (Mentés betanított modellként) lehetőséget.
Előrejelzésekhez használja a betanított modellt a Modell pontozása modul bemeneteként .

A nem korlátozott modell a modell keresztellenőrzése számára is átküldhető a címkézett adatkészletek keresztellenőrzése érdekében.

Példák

A Two-Class Bayes Point Machine gépi tanulásban való használata érdekében tekintse meg a következő mintakísérleteket a Azure AI Gallery:

Bináris osztályozók összehasonlítása: Ez a minta több kétosztályos osztályozó használatát mutatja be.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit és az algoritmussal kapcsolatos gyakori kérdéseket tartalmazza.

Az eredeti kutatás és a mögöttes elmélet részletei ebben a tanulmányban (PDF) érhetők el: Bayes Point Machines, Herbert, Graepe és

Ez az implementáció azonban többféleképpen is javít az eredeti algoritmuson:

A várt propagálási üzenetát átadási algoritmust használja. További információ: Egy körülbelül Bayes-i következtetéshez használt algoritmusok egy családja.
Nincs szükség paraméteres lekérdezésre.
Ez a módszer nem követeli meg az adatok normalizálását.

Ezekkel a fejlesztésekkel a Bayes Point Machine besorolási modellje robusztusabb és könnyebben használható lesz, és elkerülheti a paraméterek finomhangolásának időigényes lépését.

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
Betanítási iterációk száma	>=1	Egész szám	30	A betanítás során használni kívánt iterációk számának megadása
Elfogultság	Bármelyik	Logikai	Igaz	Annak jelzése, hogy állandó jellemzőt vagy torzítást kell-e hozzáadni az egyes példányhoz
Ismeretlen értékek engedélyezése kategorikus jellemzőkben	Bármelyik	Logikai	Igaz	Ha igaz, a minden kategorikus oszlophoz létrehoz egy további szintet. A tesztadatkészletnek a betanítás adatkészletében nem elérhető szintjei erre a további szintre vannak leképezve.

Kimenet

Név	Típus	Description
Nem korlátozott modell	ILearner interfész	Nem korlátozott bináris besorolási modell

Lásd még

ClassificationA-Z modullista

Megosztás a következőn keresztül: