Machine Learning – Betanítás
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a cikk a Machine Learning Studio (klasszikus) által a gépi tanulási modell betanításhoz biztosított moduljait ismerteti. A betanítás a bemeneti adatok előre meghatározott modell paramétereivel való elemzésének folyamata. Ebben az elemzésben a modell megtanulja a mintákat, és betanított modell formájában menti őket.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Ez a cikk a Machine Learning Studio (klasszikus) modellkészítési, betanítási, kiértékelési és pontozási folyamatait is ismerteti.
Gépi tanulási modellek létrehozása és használata
A gépi tanulás tipikus munkafolyamata a következő fázisokat foglalja magában:
- A megfelelő algoritmus kiválasztása és a kezdeti beállítások megadása.
- A modell betanítása kompatibilis adatok alapján.
- Előrejelzések létrehozása új adatokkal a modell mintái alapján.
- A modell kiértékelését annak megállapításához, hogy az előrejelzések pontosak-e, mennyi hiba van, és hogy van-e túlilledés.
Machine Learning Studio (klasszikus) rugalmas, testreszabható gépi tanulási keretrendszert támogat. A folyamat minden feladatát egy adott modultípus végzi el, amely a kísérlet többi része nélkül módosítható, hozzáadható vagy eltávolítható.
Az ebbe a kategóriába tartozó modulok támogatják a különböző modelltípusok betanításait. A betanítás során az adatokat a gépi tanulási algoritmus elemzi. Ez az algoritmus elemzi az adatok eloszlását és típusát, lefordítja a statisztikákat, és mintákat hoz létre, amelyek később felhasználhatók az előrejelzéshez.
További információk a modell betanításról
Ha Machine Learning betanít egy modellt, a hiányzó értékeket tartalmazó sorok ki vannak hagyva. Ezért ha manuálisan szeretné kijavítani az értékeket, használjon imputálást, vagy adjon meg egy másik módszert a hiányzó értékek kezeléséhez, használja a Clean Missing Data (Hiányzó adatok megtisztítása) modult az adatkészlet betanítása előtt.
Javasoljuk, hogy az adatokkal kapcsolatos egyéb problémák megoldásához használja a Metaadatok szerkesztése modult. Előfordulhat, hogy meg kell jelölnie a címkeoszlopot, módosítania kell az adattípusokat, vagy helyes oszlopneveket kell módosítania.
További gyakori adat tisztítási feladatok, például normalizálás, mintavételezés, rögzítés és skálázás esetén tekintse meg az Adatátalakítás kategóriát .
A megfelelő tréner kiválasztása
A modell betanítása a létrehozott modell típusától és a modell által megkövetelt adatok típusától függ. Például a Machine Learning modulokat biztosít az anomáliadetektálási modellek, javaslati modellek stb. betanítása érdekében.
Tekintse meg a betanító modulok listáját , és állapítsa meg, melyik a megfelelő az adott forgatókönyvhöz.
Ha nem biztos abban, hogy melyik legjobb paramétereket használja a modell betanítása során, használja a paraméterek átvizsgálása és ellenőrzése érdekében megadott modulok valamelyikét:
A Modell-hiperparaméterek hangolása szinte minden besorolási és regressziós modellen elvégezheti a paraméteres átvizsgálást. Több modellt is beképz, majd a legjobb modellt adja vissza.
A Fürtözéses fürtszolgáltatás modul támogatja a modellek finomhangolását a betanítási folyamat során, és csak fürtözési modellekkel való használatra szolgál. Megadhat egy tartományt a centroidok számára, és az adatokon való betanításkor automatikusan észlelheti a legjobb paramétereket.
A Modell kereszt-ellenőrzése modul a modelloptimalizáláshoz is hasznos, de nem ad vissza betanított modellt. Ehelyett metrikákat biztosít, amelyek segítségével meghatározhatja a legjobb modellt.
Modellek újratanítása
Ha újra kell képezni egy éles modellt, bármikor újra futtathatja a kísérletet.
Az újraképzési folyamatot webszolgáltatások használatával is automatizálhatja. Az útmutatót lásd: Az új modellek Machine Learning frissítése a Azure Data Factory.
Előre beképezett modellek használata
Machine Learning tartalmaz néhány előre beképezett modellt, például az Előre korlátozott Kaszkádolt képbesorolás modult. Ezeket a modelleket további adatbemenet nélkül is pontozhatja.
Emellett egyes modulok (például a Time Series Anomaly Detection) nem hoznak létre betanított modellt iLearner formátumban. De a betanítás adataival belsőleg létrehoznak egy modellt, amely aztán előrejelzésekhez használható. A használatukhoz csak konfigurálnia kell a paramétereket, és meg kell adnia az adatokat.
Betanított modell pillanatképének mentése
Ha menteni vagy exportálni szeretné a modellt, kattintson a jobb gombbal a betanítás modulra, és válassza a Mentés betanított modellként lehetőséget. A modell iLearner formátumba lesz exportálva, és a munkaterületre lesz mentve a Betanított modellek alatt. A betanított modellek újra felhasználhatók más kísérletekben, vagy összekapcsolhatóak más modulokhoz pontozáshoz.
Egy kísérletben a Load Trained Model (Betanított modell betöltése) modullal is lekérhet egy tárolt modellt.
Modulok listája
A Betanítás kategória a következő modulokat tartalmazza:
- Fürtszolgáltatás-átkésés: Paraméteres átvizsgálás egy fürtözési modellen az optimális paraméterbeállítások meghatározásához és a legjobb modell beképezéséhez.
- Anomáliadetektálási modell betanítása: Betanít egy anomáliadetektor-modellt, és felcímkéz adatokat egy betanításkészletből.
- Fürtözési modell betanítása: Betanít egy fürtözési modellt, és a betanításkészletből származó adatokat fürtökhöz rendeli.
- Matchbox-ajánló betanítás: Egy Bayes-ajánló betanítás a Matchbox algoritmussal.
- Modell betanítása: Betanít egy besorolási vagy regressziós modellt egy betanítási készletből.
- Modell-hiperparaméterek hangolása: Paraméteres lekérdezést végez egy regressziós vagy besorolási modellen az optimális paraméterbeállítások meghatározásához, és a legjobb modell betanítója.
Kapcsolódó feladatok
Egyes modulok nem tartoznak ebbe a kategóriába, mert speciális formátumot igényelnek, vagy egy adott feladathoz vannak testre szabva:
- Rendellenesség-észlelési modell betanítása
- Vowpal Wabbit 7-4-es verzió betanítás
- Vowpal Wabbit 7-10-es verzió betanítás
- Vowpal Wabbit 8-as verzió betanítás
- Rejtett Dirichlet-lefoglalás