SVD-ajánló betanítása
Ez a cikk bemutatja, hogyan használható a Train SVD Recommender összetevő az Azure Machine Learning Designerben. Ezzel az összetevővel betanított egy javaslatmodellt az egyértékű felbontási (SVD) algoritmus alapján.
Az SVD-ajánló betanítása összetevő három felhasználó-elem minősítésű adathalmazt olvas be. Egy betanított SVD-ajánlót ad vissza. Ezt követően a betanított modell használatával előrejelezheti az értékeléseket, vagy javaslatokat hozhat létre a Score SVD Recommender összetevő csatlakoztatásával.
További információ a javaslatmodellekről és az SVD-ajánlóról
A javaslati rendszer fő célja egy vagy több elem ajánlása a rendszer felhasználóinak. Ilyen lehet például egy film, étterem, könyv vagy dal. A felhasználó lehet egy személy, egy személycsoport vagy egy másik, elembeállításokkal rendelkező entitás.
Az ajánló rendszereknek két fő megközelítése van:
- A tartalomalapú megközelítés a felhasználók és az elemek funkcióit is használja. A felhasználók olyan tulajdonságok szerint írhatók le, mint az életkor és a nem. Az elemek leírását tulajdonságok, például a szerző és a gyártó végezheti el. A közösségi egyezés-készítési webhelyeken tipikus példákat találhat a tartalomalapú javaslati rendszerekre.
- Az együttműködésen alapuló szűrés csak a felhasználók és az elemek azonosítóit használja. Implicit információkat kap ezekről az entitásokról a felhasználók által az elemekre adott minősítések (ritka) mátrixából. A felhasználókat az általuk értékelt elemekből és más felhasználókból ismerhetjük meg, akik ugyanazokat az elemeket értékelték.
Az SVD-ajánló a felhasználók és az elemek azonosítóit, valamint a felhasználók által az elemekre adott értékelések mátrixát használja. Ez egy együttműködési ajánló.
Az SVD-ajánlóról további információt a vonatkozó kutatási tanulmányban talál: Mátrix factorization techniques for recommender systems.
SvD-ajánló konfigurálása
Adatok előkészítése
Az összetevő használata előtt a bemeneti adatoknak a javaslati modell által várt formátumban kell lenniük. Betanítási adatkészletre van szükség, amely a felhasználó-elem minősítési háromszorosát tartalmazza.
- Az első oszlop felhasználói azonosítókat tartalmaz.
- A második oszlop elemazonosítókat tartalmaz.
- A harmadik oszlop a felhasználó-elem pár minősítését tartalmazza. A minősítési értékeknek numerikus típusnak kell lenniük.
Az Azure Machine Learning Designer Movie Ratings adatkészlete (az Adathalmazok és a Minták kiválasztása) a várt formátumot mutatja be:
Ebből a mintából láthatja, hogy egyetlen felhasználó több filmet is értékelt.
A modell betanítása
Adja hozzá a Train SVD Recommender összetevőt a folyamathoz a tervezőben, és csatlakoztassa a betanítási adatokhoz.
A faktorok száma mezőben adja meg az ajánlóval használandó tényezők számát.
Minden tényező azt méri, hogy a felhasználó mennyire kapcsolódik az elemhez. A tényezők száma a látens faktortér dimenziója is. A felhasználók és elemek számának növekedésével jobb, ha nagyobb számú tényezőt állít be. Ha azonban a szám túl nagy, a teljesítmény csökkenhet.
A javaslati algoritmus iterációinak száma azt jelzi, hogy az algoritmusnak hányszor kell feldolgoznia a bemeneti adatokat. Minél magasabb ez a szám, annál pontosabbak az előrejelzések. A magasabb szám azonban lassabb betanítást jelent. Az alapértelmezett érték 30.
A tanulási sebességhez adjon meg egy 0,0 és 2,0 közötti számot, amely meghatározza a tanulás lépésméretét.
A tanulási sebesség határozza meg a lépés méretét az egyes iterációkban. Ha a lépés mérete túl nagy, előfordulhat, hogy túllépi az optimális megoldást. Ha a lépés mérete túl kicsi, a betanítás hosszabb időt vesz igénybe a legjobb megoldás megtalálásához.
Küldje el a folyamatot.
Results (Eredmények)
A folyamatfeladat befejezése után a modell pontozáshoz való használatához csatlakoztassa az SVD-ajánló betanítása az SVD-ajánló pontszámához az új bemeneti példák értékeinek előrejelzéséhez.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket.