Megosztás a következőn keresztül:


Modell betanítása összetevő

Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.

Ezzel az összetevővel betanítsa a besorolási vagy regressziós modellt. A betanítás azután történik, hogy definiált egy modellt, és beállította annak paramétereit, és címkézett adatokat igényel. A Modell betanításával új adatokkal újratanítást is végezhet egy meglévő modellen.

A betanítási folyamat működése

Az Azure Machine Learningben a gépi tanulási modell létrehozása és használata általában három lépésből áll.

  1. A modell konfigurálásához válasszon ki egy adott algoritmustípust, és határozza meg annak paramétereit vagy hiperparamétereit. Válasszon az alábbi modelltípusok közül:

    • Neurális hálózatokon, döntési fákon, döntési erdőkön és más algoritmusokon alapuló besorolási modellek.
    • Regressziós modellek, amelyek tartalmazhatnak standard lineáris regressziót, vagy amelyek más algoritmusokat használnak, beleértve a neurális hálózatokat és a Bayes-regressziót.
  2. Adjon meg egy címkézett és az algoritmussal kompatibilis adatokat tartalmazó adathalmazt. Csatlakoztassa az adatokat és a modellt a Modell betanítása szolgáltatáshoz.

    A betanítás egy adott bináris formátum, az iLearner, amely az adatokból tanult statisztikai mintákat foglalja magában. Ezt a formátumot nem módosíthatja vagy olvashatja közvetlenül; más összetevők azonban használhatják ezt a betanított modellt.

    A modell tulajdonságait is megtekintheti. További információ: Eredmények szakasz.

  3. A betanítás befejezése után használja a betanított modellt az egyik pontozási összetevővel, hogy előrejelzéseket készítsen az új adatokról.

A modell betanítása

  1. Adja hozzá a Modell betanítása összetevőt a folyamathoz. Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Betanítás elemet, majd húzza a Modell betanítása összetevőt a folyamatba.

  2. A bal oldali bemeneten csatlakoztassa a nem betanított módot. Csatolja a betanítási adatkészletet a Modell betanítása jobb oldali bemenetéhez.

    A betanítási adatkészletnek tartalmaznia kell egy címkeoszlopot. A címkék nélküli sorok figyelmen kívül lesznek hagyva.

  3. A Label (Címke) oszlopnál kattintson az Oszlop szerkesztése elemre az összetevő jobb oldali paneljén, és válasszon ki egy olyan oszlopot, amely a modell által a betanításhoz használható eredményeket tartalmazza.

    • Besorolási problémák esetén a címkeoszlopnak kategorikus vagy különálló értékeket kell tartalmaznia. Néhány példa lehet egy igen/nem minősítés, egy betegségbesorolási kód vagy név, vagy egy jövedelemcsoport. Ha nem akategorikus oszlopot választ, az összetevő hibát ad vissza a betanítás során.

    • Regressziós problémák esetén a címkeoszlopnak numerikus adatokat kell tartalmaznia, amelyek a válaszváltozót jelölik. Ideális esetben a numerikus adatok folyamatos skálázást jelölnek.

    Ilyen lehet például a hitelkockázati pontszám, a merevlemez meghibásodásának előrejelzett ideje, vagy egy adott napon vagy időpontban a call centerbe irányuló hívások előrejelzett száma. Ha nem numerikus oszlopot választ, hibaüzenet jelenhet meg.

    • Ha nem adja meg, hogy melyik címkeoszlopot használja, az Azure Machine Learning az adathalmaz metaadatainak használatával megpróbálja kikövetkeztetni, hogy melyik a megfelelő címkeoszlop. Ha nem a megfelelő oszlopot választja, az oszlopválasztóval javítsa ki.

    Tipp

    Ha nem tudja használni az Oszlopválasztót, tippekért tekintse meg az Adathalmaz oszlopainak kijelölése című cikket. Néhány gyakori forgatókönyvet és tippet ismertet a WITH RULES és a BY NAME beállítás használatához.

  4. Küldje el a folyamatot. Ha sok adata van, az eltarthat egy ideig.

    Fontos

    Ha van egy azonosító oszlopa, amely az egyes sorok azonosítója, vagy egy szövegoszlop, amely túl sok egyedi értéket tartalmaz, a Modell betanítása hibaüzenetet kaphat, például: "A(z) "{column_name}" oszlopban lévő egyedi értékek száma nagyobb az engedélyezettnél.

    Ennek az az oka, hogy az oszlop elérte az egyedi értékek küszöbértékét, és memóriakihasználtságot okozhat. A Metaadatok szerkesztése funkcióval megjelölheti ezt az oszlopot Törlés funkcióként , és nem használható a betanításban, vagy N-Gram-szolgáltatások kinyerésére a Szöveg összetevőből a szövegoszlop előfeldolgozásához. További hibaadatokért lásd: Tervező hibakód.

Modellértelmezhetőség

A modellértelmezhetőség lehetővé teszi az ML-modell megértését és a döntéshozatal alapjául szolgáló alap bemutatását az emberek számára érthető módon.

A Modell betanítása összetevő jelenleg támogatja az értelmezőcsomag használatát az ML-modellek magyarázatához. Az alábbi beépített algoritmusok támogatottak:

  • Lineáris regresszió
  • Neurális hálózat típusú regresszió
  • Növelt decistion tree regresszió
  • Döntési erdő típusú regresszió
  • Poisson-regresszió
  • Kétosztályos logisztikai regresszió
  • Kétosztályos támogató vektorgép
  • Two-Class növelt decistion fa
  • Kétosztályos döntési erdő
  • Többosztályos döntési erdő
  • Többosztályos logisztikai regresszió
  • Többosztályos neurális hálózat

Modellmagyarázatok létrehozásához válassza az Igaz lehetőséget a Modellmagyarázat betanítása összetevő legördülő listájában. Alapértelmezés szerint False (Hamis) értékre van állítva a Modell betanítása összetevőben. Vegye figyelembe, hogy a magyarázat létrehozásához további számítási költségekre van szükség.

Képernyőkép a modell magyarázata jelölőnégyzetről

Miután a folyamatfuttatás befejeződött, a Modell betanítása összetevő jobb oldali paneljének Magyarázatok lapjára látogathat, és megismerheti a modell teljesítményét, az adathalmazt és a funkció fontosságát.

Képernyőkép a modellmagyarázat-diagramokról

Ha többet szeretne megtudni a modellmagyarázatok Azure Machine Learningben való használatáról, tekintse meg az ML-modellek értelmezéséről szóló útmutató cikket.

Results (Eredmények)

A modell betanítása után:

  • Ha a modellt más folyamatokban szeretné használni, válassza ki az összetevőt, és válassza az Adathalmaz regisztrálása ikont a jobb oldali panel Kimenetek lapján. A mentett modellek az összetevők palettáján, az Adatkészletek területen érhetők el.

  • Ha a modellt új értékek előrejelzéséhez szeretné használni, csatlakoztassa a Modell pontozása összetevőhöz az új bemeneti adatokkal együtt.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .