Megosztás a következőn keresztül:


Machine Learning – Betanítás

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk a Machine Learning Studio (klasszikus) által a gépi tanulási modell betanításhoz biztosított moduljait ismerteti. A betanítás a bemeneti adatok előre meghatározott modell paramétereivel való elemzésének folyamata. Ebben az elemzésben a modell megtanulja a mintákat, és betanított modell formájában menti őket.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Ez a cikk a Machine Learning Studio (klasszikus) modellkészítési, betanítási, kiértékelési és pontozási folyamatait is ismerteti.

Gépi tanulási modellek létrehozása és használata

A gépi tanulás tipikus munkafolyamata a következő fázisokat foglalja magában:

  • A megfelelő algoritmus kiválasztása és a kezdeti beállítások megadása.
  • A modell betanítása kompatibilis adatok alapján.
  • Előrejelzések létrehozása új adatokkal a modell mintái alapján.
  • A modell kiértékelését annak megállapításához, hogy az előrejelzések pontosak-e, mennyi hiba van, és hogy van-e túlilledés.

Machine Learning Studio (klasszikus) rugalmas, testreszabható gépi tanulási keretrendszert támogat. A folyamat minden feladatát egy adott modultípus végzi el, amely a kísérlet többi része nélkül módosítható, hozzáadható vagy eltávolítható.

Az ebbe a kategóriába tartozó modulok támogatják a különböző modelltípusok betanításait. A betanítás során az adatokat a gépi tanulási algoritmus elemzi. Ez az algoritmus elemzi az adatok eloszlását és típusát, lefordítja a statisztikákat, és mintákat hoz létre, amelyek később felhasználhatók az előrejelzéshez.

További információk a modell betanításról

Ha Machine Learning betanít egy modellt, a hiányzó értékeket tartalmazó sorok ki vannak hagyva. Ezért ha manuálisan szeretné kijavítani az értékeket, használjon imputálást, vagy adjon meg egy másik módszert a hiányzó értékek kezeléséhez, használja a Clean Missing Data (Hiányzó adatok megtisztítása) modult az adatkészlet betanítása előtt.

Javasoljuk, hogy az adatokkal kapcsolatos egyéb problémák megoldásához használja a Metaadatok szerkesztése modult. Előfordulhat, hogy meg kell jelölnie a címkeoszlopot, módosítania kell az adattípusokat, vagy helyes oszlopneveket kell módosítania.

További gyakori adat tisztítási feladatok, például normalizálás, mintavételezés, rögzítés és skálázás esetén tekintse meg az Adatátalakítás kategóriát .

A megfelelő tréner kiválasztása

A modell betanítása a létrehozott modell típusától és a modell által megkövetelt adatok típusától függ. Például a Machine Learning modulokat biztosít az anomáliadetektálási modellek, javaslati modellek stb. betanítása érdekében.

Tekintse meg a betanító modulok listáját , és állapítsa meg, melyik a megfelelő az adott forgatókönyvhöz.

Ha nem biztos abban, hogy melyik legjobb paramétereket használja a modell betanítása során, használja a paraméterek átvizsgálása és ellenőrzése érdekében megadott modulok valamelyikét:

  • A Modell-hiperparaméterek hangolása szinte minden besorolási és regressziós modellen elvégezheti a paraméteres átvizsgálást. Több modellt is beképz, majd a legjobb modellt adja vissza.

  • A Fürtözéses fürtszolgáltatás modul támogatja a modellek finomhangolását a betanítási folyamat során, és csak fürtözési modellekkel való használatra szolgál. Megadhat egy tartományt a centroidok számára, és az adatokon való betanításkor automatikusan észlelheti a legjobb paramétereket.

  • A Modell kereszt-ellenőrzése modul a modelloptimalizáláshoz is hasznos, de nem ad vissza betanított modellt. Ehelyett metrikákat biztosít, amelyek segítségével meghatározhatja a legjobb modellt.

Modellek újratanítása

Ha újra kell képezni egy éles modellt, bármikor újra futtathatja a kísérletet.

Az újraképzési folyamatot webszolgáltatások használatával is automatizálhatja. Az útmutatót lásd: Az új modellek Machine Learning frissítése a Azure Data Factory.

Előre beképezett modellek használata

Machine Learning tartalmaz néhány előre beképezett modellt, például az Előre korlátozott Kaszkádolt képbesorolás modult. Ezeket a modelleket további adatbemenet nélkül is pontozhatja.

Emellett egyes modulok (például a Time Series Anomaly Detection) nem hoznak létre betanított modellt iLearner formátumban. De a betanítás adataival belsőleg létrehoznak egy modellt, amely aztán előrejelzésekhez használható. A használatukhoz csak konfigurálnia kell a paramétereket, és meg kell adnia az adatokat.

Betanított modell pillanatképének mentése

Ha menteni vagy exportálni szeretné a modellt, kattintson a jobb gombbal a betanítás modulra, és válassza a Mentés betanított modellként lehetőséget. A modell iLearner formátumba lesz exportálva, és a munkaterületre lesz mentve a Betanított modellek alatt. A betanított modellek újra felhasználhatók más kísérletekben, vagy összekapcsolhatóak más modulokhoz pontozáshoz.

Egy kísérletben a Load Trained Model (Betanított modell betöltése) modullal is lekérhet egy tárolt modellt.

Modulok listája

A Betanítás kategória a következő modulokat tartalmazza:

Egyes modulok nem tartoznak ebbe a kategóriába, mert speciális formátumot igényelnek, vagy egy adott feladathoz vannak testre szabva:

Lásd még