Megosztás a következőn keresztül:


Sorszámregresszió

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Sorszám-regressziós modellt hoz létre

Kategória: Machine Learning / Modell inicializálása / Regresszió

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio (klasszikus) Sorszámregresszió modulja egy regressziós modell létrehozásához, amely rangsorolt értékek előrejelzésére használható.

Néhány példa a rangsorolt értékekre:

  • Felmérési válaszok, amelyek egy 1–5 skálán rögzítik a felhasználó előnyben részesített márkáit
  • A versenyben a befejezések sorrendje
  • URL-címek a rangsorolt keresési eredményekben

További információ a sorszám-regresszióról

A sorszám-regresszió akkor használatos, ha a címke vagy a céloszlop számokat tartalmaz, de a számok nem numerikus, hanem rangsorolást vagy sorrendet képviselnek.

A sorszámok előrejelzéséhez más algoritmusra van szükség, mint a folyamatos skálázásban lévő számok értékeinek előrejelzésére, mert a rangsorrendhez rendelt számok nem belső skálázhatóak.

A tanulók tesztpontszámainak előrejelzésére például egy standard regressziós modellt használna, mivel a tanulók teszteredménye folyamatosan változik és mérhető. Az osztály rangsorolásának előrejelzése azonban egy sorszám-regressziós modellel előrejelzhető.

Az algoritmussal kapcsolatos kutatásokkal kapcsolatos további információkért tekintse meg ezt a dokumentumot (letölthető PDF): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Sorszámregresszió konfigurálása

Ez a modul egy rangsorolási problémát old meg kapcsolódó besorolási problémák sorozataként. Ezért az algoritmus kiterjesztett betanításpélmát hoz létre bináris modellel minden ranghoz, és betanítja a bővített készletet. Ez a művelet számítási szempontból költséges lehet.

  1. Adja hozzá a Sorszám regressziós modell modult a kísérlethez a Studióban (klasszikus). Ezt a modult a RegresszióMachine Learning inicializálása szakaszban találja.

  2. Adjon hozzá egy bináris besorolást támogató modult, és konfigurálja a modellt. A besorolási kategóriában több kétosztályos modul is van.

  3. Csatlakozás bináris besorolási modellt a sorszámregressziós modell modul bemeneteként adja meg.

  4. A sorszám-regressziós modellhez nincs szükség további paraméterekre; az algoritmus előre konfigurálva van a rangsorolási probléma megoldásának leghatékonyabb paramétereivel.

  5. Csatlakozás betanítás adatkészletét és a Modell betanítása modult.

  6. A Train Model (Modell betanítása) modulban válassza ki a rangsorértékeket tartalmazó oszlopot.

    A rangsorértéknek numerikus értékeknek kell lennie, de nem kell egész számoknak vagy pozitív számoknak lennie, amíg sorrendet képviselnek.

    Feldolgozás céljából a rangsorok sorrendje 1–K, ahol az 1 a legalacsonyabb, a K pedig a legmagasabb. A Train Model ( Modell betanítása) modul azonban akkor is működik, ha a méretezés szemantikája megfordul.

    Ha például az eredeti felmérésben az 1 volt a legmagasabb pontszám, az 5 a legalacsonyabb, az nincs hatással a modell feldolgozására.

  7. Futtassa a kísérletet.

Results (Eredmények)

A betanítás befejezése után:

Példák

A gépi tanulásban a sorszámregresszió használatára vonatkozó példákért lásd a Azure AI Gallery.

  • Prediktív karbantartás – C. lépés: Ebben a példában a sorszámregresszió az értékek besorolási modell szerinti rangsorolására használható, feltételezve, hogy az érték tükrözi a hibabesorolás súlyosságát.

Technikai megjegyzések

Az ebben a tanulóban használt sorszámregressziós algoritmus kiterjesztett bináris besorolással valósul meg, amelyet Ling Li és Hsuan-Tien Lin, a NIPS 2006 Sorszám-regressziója című tanulmánya ismertet.

A bemeneti adatok korlátozásai

Egy sorszám-regressziós modell céljaként bármilyen numerikus oszlopot használhat, de a gyakorlatban csak olyan adatokat használjon, amelyek valamilyen sorrendet vagy rangsorolást képviselnek.

A rangsorok közötti intervallumok ismeretlennek vannak feltételezve, és az intervallum mérete nem számít a modellnek; A modell azonban feltételezi, hogy a sorszámok sorrendje a számok természetes sorrendjét követi.

Maga a modell nem rendel semmilyen jelentést egy adott skálához. Más szóval létrehozhat egy olyan modellt, amelyben az 1 a legjobb, a 10 a legrosszabb, egy másik modellben pedig feltételezzük, hogy a 10 a kívánt rang, az 1 pedig a legrosszabb.

Rangsorolási algoritmus

A betanítás készlet (X,Y) x bemeneti vektorokat és y címkéket tartalmaz. A címkék sorrendben 1 és k közötti rangsorokat képviselnek: 1,2, ... , K. A rangsorok úgy vannak megrendelve, hogy az 1 a legalacsonyabb vagy a legrosszabb, a K pedig a legjobb vagy legmagasabb rang.

Az algoritmus cruxusa abban rejlik, hogy az adott bemeneti jellemzők X és Y címkéit kiterjesztett példák használatára módosítja, majd bináris osztályozó használatával oldja meg a sorszámregressziós problémát. A bináris osztályozó úgy lett betanítva, hogy igen/nem választ adjon arra a kérdésre, hogy "Nagyobb-e a rang, mint r?"

Például a betanításkészlet minden egyes esetében vannak K-1 kiterjesztett példák, és a megfigyelt legmagasabb rang a K. A kiterjesztett jellemzők úgy alakulnak ki, hogy a K-1 x K-1 identitásmátrix I. sorát az összes i bemeneti funkcióhoz hozzáfűzik. A címkék +1-et kapnak az első r-1 sorhoz, ha a rangsor r, a többi pedig -1.

Mintaszámítások

Ennek szemléltetésére legyen x1 az a betanítási funkció, amelynek a rangja 3, ahol a megfigyelt legmagasabb rang 5. A funkcióhoz tartozó kiterjesztett példák a következők:

Case (Eset) Tesztelés Eredményül kapott címke
X11000 A rangsor nagyobb, mint 1? Igen; ezért +1
X10100 A rangsor nagyobb, mint 2? Igen; ezért +1
X10010 A rangsor nagyobb, mint 3? Nem; ezért nincs további funkció
X10001 A rangsor nagyobb, mint 4? Nem; ezért nincs további funkció

Várt bemenetek

Név Típus Description
Nem korlátozott bináris besorolási modell ILearner interfész Nem korlátozott bináris besorolási modell

Kimenetek

Név Típus Description
Nem képezett modell ILearner interfész Egy nem képezett sorszámregressziós modell

Lásd még

Regresszió