Megosztás a következőn keresztül:


Egyéni szövegbesorolási modell betanítása

A betanítás az a folyamat, amelyben a modell a címkézett adatokból tanul. A betanítás befejezése után megtekintheti a modell teljesítményét annak megállapításához, hogy javítania kell-e a modellt.

Modell betanításához indítsa el a betanítási feladatot. Csak a sikeresen befejezett feladatok hozhatnak létre használható modellt. A betanítási feladatok hét nap után lejárnak. Ezen időszak után nem fogja tudni lekérni a feladat részleteit. Ha a betanítási feladat sikeresen befejeződött, és létrejött egy modell, a feladat lejárata nem fogja befolyásolni. Egyszerre csak egy betanítási feladat futtatható, és nem indíthat el más feladatokat ugyanabban a projektben.

A betanítási idő néhány perctől kezdve bárhol előfordulhat, amikor kevés dokumentumot kezel, akár több órát is az adathalmaz méretétől és a séma összetettségétől függően.

Előfeltételek

A modell betanítása előtt a következőkre van szüksége:

További információkért tekintse meg a projektfejlesztési életciklust .

Adatok felosztása

A betanítási folyamat megkezdése előtt a projekt címkézett dokumentumai betanítási és tesztelési csoportra vannak osztva. Mindegyik egy másik függvényt szolgál ki. A betanítási csoport a modell betanításához használatos, ez az a készlet, amelyből a modell megtanulja az egyes dokumentumokhoz rendelt osztályokat/osztályokat. A tesztkészlet egy olyan vakkészlet, amely nem a betanítás során, hanem csak az értékelés során kerül bevezetésre a modellbe. A modell sikeres betanítása után a rendszer előrejelzéseket készít a tesztkészlet dokumentumaiból. Ezek alapján az előrejelzések alapján a modell kiértékelési metrikái ki lesznek számítva. Javasoljuk, hogy győződjön meg arról, hogy az összes osztály megfelelően képviselteti magát mind a betanítási, mind a tesztelési csoportban.

Az egyéni szövegbesorolás két módszert támogat az adatfelosztáshoz:

  • A tesztelési csoport automatikus felosztása a betanítási adatokból: A rendszer a kiválasztott százalékos értékeknek megfelelően felosztja a címkézett adatokat a betanítási és tesztelési csoportok között. A rendszer megkísérli az összes osztály ábrázolását a betanítási csoportban. A javasolt százalékos felosztás 80% a betanításhoz és 20% teszteléshez.

Feljegyzés

Ha a tesztelési csoport automatikus felosztását választja a betanítási adatok beállításából, akkor csak a betanítási csoporthoz rendelt adatok lesznek felosztva a megadott százalékos értékek szerint.

  • A betanítási és tesztelési adatok manuális felosztása: Ez a módszer lehetővé teszi a felhasználók számára, hogy meghatározzák, hogy mely címkézett dokumentumok tartoznak a készlethez. Ez a lépés csak akkor engedélyezett, ha az adatok címkézése során dokumentumokat adott hozzá a tesztelési csoporthoz.

Modell betanítása

A modell betanításának megkezdése a Language Studióban:

  1. A bal oldali menüben válassza a Betanítási feladatok lehetőséget.

  2. Válassza a Betanítási feladat indítása lehetőséget a felső menüben.

  3. Válassza az Új modell betanítása lehetőséget, és írja be a modell nevét a szövegmezőbe. A meglévő modell felülírásához válassza ezt a lehetőséget, és válassza ki azt a modellt, amelyet felül szeretne írni a legördülő menüből. A betanított modellek felülírása visszavonhatatlan, de az az új modell üzembe helyezéséig nem érinti az üzembe helyezett modelleket.

    Új betanítási feladat létrehozása

  4. Válassza ki az adatfelosztási módszert. Választhatja a tesztelési csoport automatikus felosztását a betanítási adatokból , ahol a rendszer a megadott százalékok szerint felosztja a címkézett adatokat a betanítási és tesztelési csoportok között. Vagy használhatja a betanítási és tesztelési adatok manuális felosztását is, ez a beállítás csak akkor engedélyezett, ha dokumentumokat adott hozzá a tesztelési csoporthoz az adatfeliratozás során. Az adatfelosztással kapcsolatos további információkért tekintse meg a modell betanítását ismertető témakört.

  5. Válassza a Betanítása gombot.

  6. Ha kiválasztja a betanítási feladat azonosítóját a listából, megjelenik egy oldalpanel, ahol ellenőrizheti a betanítás állapotát, a feladat állapotát és a feladat egyéb adatait.

    Feljegyzés

    • Csak a sikeresen befejezett betanítási feladatok hoznak létre modelleket.
    • A modell betanítása néhány perc és több óra közötti időt vehet igénybe a címkézett adatok méretétől függően.
    • Egyszerre csak egy betanítási feladat futtatható. Amíg a futó feladat be nem fejeződik, nem lehet másik betanítási feladatot elindítani ugyanabban a projektben.

Betanítási feladat megszakítása

Ha le szeretne mondani egy betanítási feladatot a Language Studióban, lépjen a Betanítási feladatok lapra. Válassza ki a megszakítani kívánt betanítási feladatot, majd a felső menüBen válassza a Mégse elemet.

Következő lépések

A betanítás befejezése után megtekintheti a modell teljesítményét , ha szükséges, igény szerint javíthatja a modellt. Ha elégedett a modellel, üzembe helyezheti, és elérhetővé teheti a szöveg besorolásához.