Megosztás a következőn keresztül:


A custom Text Analytics for health modell betanítása

A betanítás az a folyamat, amelyben a modell tanul a címkézett adatokból. A betanítás befejezése után megtekintheti a modell teljesítményét , és megállapíthatja, hogy javítania kell-e a modellt.

Modell betanításához elindít egy betanítási feladatot, és csak a sikeresen befejezett feladatok hoznak létre modellt. A betanítási feladatok hét nap után lejárnak, ami azt jelenti, hogy ez után nem fogja tudni lekérni a feladat részleteit. Ha a betanítási feladat sikeresen befejeződött, és létrejött egy modell, a modellre nincs hatással. Egyszerre csak egy betanítási feladat futhat, és nem indíthat el más feladatokat ugyanabban a projektben.

A betanítási idő néhány dokumentum kezelésekor néhány perctől akár több óráig is tarthat az adathalmaz méretétől és a séma összetettségétől függően.

Előfeltételek

További információért tekintse meg a projektfejlesztési életciklust .

Adatok felosztása

A betanítási folyamat megkezdése előtt a projekt címkézett dokumentumai betanítási és tesztelési készletre vannak osztva. Mindegyik más-más funkciót szolgál. A betanítási készlet a modell betanításához használatos. Ez az a készlet, amelyből a modell megtanulja a címkézett entitásokat, és hogy milyen szövegtartományokat kell kinyerni entitásként. A tesztelési készlet egy olyan vakkészlet, amely nem a betanítás során, hanem csak az értékelés során kerül bevezetésre a modellbe. A modell betanításának sikeres befejezése után a modell használatával előrejelzéseket készíthet a tesztelésben szereplő dokumentumokból, és ezek alapján kiszámítja a kiértékelési metrikákat . A modell betanítása és kiértékelése csak a tanult összetevőkkel rendelkező újonnan definiált entitásokra vonatkozik; ezért az állapotentitások Text Analytics ki vannak zárva a modell betanításából és kiértékeléséből, mivel azok előre összeállított összetevőkkel rendelkező entitások. Ajánlott gondoskodni arról, hogy az összes címkézett entitás megfelelően szerepeljen a betanítási és a tesztelési csoportban.

Az állapothoz készült egyéni Text Analytics két módszert támogat az adatfelosztáshoz:

  • A tesztelési csoport automatikus felosztása a betanítási adatokból:A rendszer a kiválasztott százalékos arányoknak megfelelően felosztja a címkézett adatokat a betanítási és a tesztelési készletek között. Az ajánlott százalékos felosztás 80% a betanításhoz és 20% teszteléshez.

Megjegyzés

Ha a Tesztelési csoport automatikus felosztása a betanítási adatokból beállítást választja, csak a betanítási készlethez rendelt adatok lesznek felosztva a megadott százalékos értékek szerint.

  • A betanítási és tesztelési adatok manuális felosztása: Ez a módszer lehetővé teszi a felhasználók számára, hogy meghatározzák, mely címkézett dokumentumok melyik készlethez tartoznak. Ez a lépés csak akkor engedélyezett, ha az adatok címkézése során dokumentumokat adott hozzá a tesztelési csoporthoz.

Modell betanítása

A modell betanítása a Language Studióban:

  1. A bal oldali menüben válassza a Betanítási feladatok lehetőséget.

  2. A felső menüben válassza a Betanítási feladat indítása lehetőséget.

  3. Válassza az Új modell betanítása lehetőséget, és írja be a modell nevét a szövegmezőbe. Meglévő modellt úgy is felülírhat , ha ezt a lehetőséget választja, és kiválasztja azt a modellt, amelyet felül szeretne írni a legördülő menüből. A betanított modellek felülírása visszafordíthatatlan, de az új modell üzembe helyezéséig nem lesz hatással az üzembe helyezett modellekre.

    Képernyőkép a Language Studióban a betanítási feladat létrehozásának képernyőjére.

  4. Válassza ki az adatfelosztási módszert. A tesztelési készlet automatikus felosztása betanítási adatokból lehetőséget választhatja, ahol a rendszer a megadott százalékos arányok szerint felosztja a címkézett adatokat a betanítási és a tesztelési készletek között. Vagy használhatja a betanítási és tesztelési adatok manuális felosztását is, ez a beállítás csak akkor engedélyezett, ha dokumentumokat adott hozzá a tesztelési csoporthoz. Az adatfelosztással kapcsolatos információkért tekintse meg az adatfeliratozást és a modellek betanítását ismertető cikket.

  5. Válassza a Betanítása gombot.

  6. Ha kiválasztja a betanítási feladat azonosítóját a listából, megjelenik egy oldalsó panel, ahol ellenőrizheti a betanítási folyamatot, a feladat állapotát és a feladat egyéb részleteit.

    Megjegyzés

    • Csak a sikeres betanítási feladatok hoznak létre modelleket.
    • A betanítás eltarthat néhány perc és több óra között a címkézett adatok méretétől függően.
    • Egyszerre csak egy betanítási feladat futtatható. Amíg a futó feladat be nem fejeződik, nem lehet másik betanítási feladatot elindítani ugyanabban a projektben.

Betanítási feladat megszakítása

Ha le szeretne mondani egy betanítási feladatot a Language Studióban, lépjen a Betanítási feladatok lapra . Válassza ki a megszakítani kívánt betanítási feladatot, majd a felső menüben válassza a Mégse lehetőséget.

Következő lépések

A betanítás befejezése után megtekintheti a modell teljesítményét , ha szükséges, igény szerint javíthatja a modellt. Miután elégedett a modellel, üzembe helyezheti azt, és elérhetővé teheti az entitások szövegből való kinyeréséhez .