Sorszámregresszió
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Sorszám-regressziós modellt hoz létre
Kategória: Machine Learning / Modell inicializálása / Regresszió
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio (klasszikus) Sorszámregresszió modulja egy regressziós modell létrehozásához, amely rangsorolt értékek előrejelzésére használható.
Néhány példa a rangsorolt értékekre:
- Felmérési válaszok, amelyek egy 1–5 skálán rögzítik a felhasználó előnyben részesített márkáit
- A versenyben a befejezések sorrendje
- URL-címek a rangsorolt keresési eredményekben
További információ a sorszám-regresszióról
A sorszám-regresszió akkor használatos, ha a címke vagy a céloszlop számokat tartalmaz, de a számok nem numerikus, hanem rangsorolást vagy sorrendet képviselnek.
A sorszámok előrejelzéséhez más algoritmusra van szükség, mint a folyamatos skálázásban lévő számok értékeinek előrejelzésére, mert a rangsorrendhez rendelt számok nem belső skálázhatóak.
A tanulók tesztpontszámainak előrejelzésére például egy standard regressziós modellt használna, mivel a tanulók teszteredménye folyamatosan változik és mérhető. Az osztály rangsorolásának előrejelzése azonban egy sorszám-regressziós modellel előrejelzhető.
Az algoritmussal kapcsolatos kutatásokkal kapcsolatos további információkért tekintse meg ezt a dokumentumot (letölthető PDF): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf
Sorszámregresszió konfigurálása
Ez a modul egy rangsorolási problémát old meg kapcsolódó besorolási problémák sorozataként. Ezért az algoritmus kiterjesztett betanításpélmát hoz létre bináris modellel minden ranghoz, és betanítja a bővített készletet. Ez a művelet számítási szempontból költséges lehet.
Adja hozzá a Sorszám regressziós modell modult a kísérlethez a Studióban (klasszikus). Ezt a modult a RegresszióMachine Learning inicializálása szakaszban találja.
Adjon hozzá egy bináris besorolást támogató modult, és konfigurálja a modellt. A besorolási kategóriában több kétosztályos modul is van.
Csatlakozás bináris besorolási modellt a sorszámregressziós modell modul bemeneteként adja meg.
A sorszám-regressziós modellhez nincs szükség további paraméterekre; az algoritmus előre konfigurálva van a rangsorolási probléma megoldásának leghatékonyabb paramétereivel.
Csatlakozás betanítás adatkészletét és a Modell betanítása modult.
A Train Model (Modell betanítása) modulban válassza ki a rangsorértékeket tartalmazó oszlopot.
A rangsorértéknek numerikus értékeknek kell lennie, de nem kell egész számoknak vagy pozitív számoknak lennie, amíg sorrendet képviselnek.
Feldolgozás céljából a rangsorok sorrendje 1–K, ahol az 1 a legalacsonyabb, a K pedig a legmagasabb. A Train Model ( Modell betanítása) modul azonban akkor is működik, ha a méretezés szemantikája megfordul.
Ha például az eredeti felmérésben az 1 volt a legmagasabb pontszám, az 5 a legalacsonyabb, az nincs hatással a modell feldolgozására.
Futtassa a kísérletet.
Results (Eredmények)
A betanítás befejezése után:
Az előrejelzésekhez csatlakoztassa a betanított modellt és az új adatokat a Score Model (Modell pontozása) modulhoz .
Ha keresztellenőrzést szeretne végezni egy címkézett adathalmazon, csatlakoztassa a nem képezett modellt a Modell keresztellenőrzése hez.
Példák
A gépi tanulásban a sorszámregresszió használatára vonatkozó példákért lásd a Azure AI Gallery.
- Prediktív karbantartás – C. lépés: Ebben a példában a sorszámregresszió az értékek besorolási modell szerinti rangsorolására használható, feltételezve, hogy az érték tükrözi a hibabesorolás súlyosságát.
Technikai megjegyzések
Az ebben a tanulóban használt sorszámregressziós algoritmus kiterjesztett bináris besorolással valósul meg, amelyet Ling Li és Hsuan-Tien Lin, a NIPS 2006 Sorszám-regressziója című tanulmánya ismertet.
A bemeneti adatok korlátozásai
Egy sorszám-regressziós modell céljaként bármilyen numerikus oszlopot használhat, de a gyakorlatban csak olyan adatokat használjon, amelyek valamilyen sorrendet vagy rangsorolást képviselnek.
A rangsorok közötti intervallumok ismeretlennek vannak feltételezve, és az intervallum mérete nem számít a modellnek; A modell azonban feltételezi, hogy a sorszámok sorrendje a számok természetes sorrendjét követi.
Maga a modell nem rendel semmilyen jelentést egy adott skálához. Más szóval létrehozhat egy olyan modellt, amelyben az 1 a legjobb, a 10 a legrosszabb, egy másik modellben pedig feltételezzük, hogy a 10 a kívánt rang, az 1 pedig a legrosszabb.
Rangsorolási algoritmus
A betanítás készlet (X,Y) x bemeneti vektorokat és y címkéket tartalmaz. A címkék sorrendben 1 és k közötti rangsorokat képviselnek: 1,2, ... , K. A rangsorok úgy vannak megrendelve, hogy az 1 a legalacsonyabb vagy a legrosszabb, a K pedig a legjobb vagy legmagasabb rang.
Az algoritmus cruxusa abban rejlik, hogy az adott bemeneti jellemzők X és Y címkéit kiterjesztett példák használatára módosítja, majd bináris osztályozó használatával oldja meg a sorszámregressziós problémát. A bináris osztályozó úgy lett betanítva, hogy igen/nem választ adjon arra a kérdésre, hogy "Nagyobb-e a rang, mint r?"
Például a betanításkészlet minden egyes esetében vannak K-1 kiterjesztett példák, és a megfigyelt legmagasabb rang a K. A kiterjesztett jellemzők úgy alakulnak ki, hogy a K-1 x K-1 identitásmátrix I. sorát az összes i bemeneti funkcióhoz hozzáfűzik. A címkék +1-et kapnak az első r-1 sorhoz, ha a rangsor r, a többi pedig -1.
Mintaszámítások
Ennek szemléltetésére legyen x1 az a betanítási funkció, amelynek a rangja 3, ahol a megfigyelt legmagasabb rang 5. A funkcióhoz tartozó kiterjesztett példák a következők:
Case (Eset) | Tesztelés | Eredményül kapott címke |
---|---|---|
X11000 | A rangsor nagyobb, mint 1? | Igen; ezért +1 |
X10100 | A rangsor nagyobb, mint 2? | Igen; ezért +1 |
X10010 | A rangsor nagyobb, mint 3? | Nem; ezért nincs további funkció |
X10001 | A rangsor nagyobb, mint 4? | Nem; ezért nincs további funkció |
Várt bemenetek
Név | Típus | Description |
---|---|---|
Nem korlátozott bináris besorolási modell | ILearner interfész | Nem korlátozott bináris besorolási modell |
Kimenetek
Név | Típus | Description |
---|---|---|
Nem képezett modell | ILearner interfész | Egy nem képezett sorszámregressziós modell |