Egyéni szövegbesorolási modell betanítása
A betanítás az a folyamat, amelyben a modell a címkézett adatokból tanul. A betanítás befejezése után megtekintheti a modell teljesítményét annak megállapításához, hogy javítania kell-e a modellt.
Modell betanításához kezdjen el egy betanítási feladatot. Csak a sikeresen befejezett feladatok hozhatnak létre használható modellt. A betanítási feladatok hét nap elteltével lejárnak. Ezen időszak után nem fogja tudni lekérni a feladat részleteit. Ha a betanítási feladat sikeresen befejeződött, és létrejött egy modell, a feladat lejárata nem befolyásolja. Egyszerre csak egy betanítási feladatot futtathat, és nem indíthat el más feladatokat ugyanabban a projektben.
A betanítási idő néhány dokumentum kezelésekor néhány perctől akár több óráig is tarthat az adathalmaz méretétől és a séma összetettségétől függően.
Előfeltételek
A modell betanítása előtt a következőkre van szüksége:
- Sikeresen létrehozott projekt egy konfigurált Azure Blob Storage-fiókkal,
- A tárfiókba feltöltött szöveges adatok.
- Címkézett adatok
További információért tekintse meg a projektfejlesztési életciklust .
Adatok felosztása
A betanítási folyamat megkezdése előtt a projekt címkézett dokumentumai betanítási és tesztelési készletre vannak osztva. Mindegyik egy másik függvényt szolgál. A betanítási készlet a modell betanításához használatos. Ez az a készlet, amelyből a modell megtanulja az egyes dokumentumokhoz rendelt osztályokat/osztályokat. A tesztelési készlet egy vakkészlet, amely nem a betanítás során, hanem csak a kiértékelés során kerül bevezetésre a modellbe. A modell sikeres betanítása után előrejelzéseket készít a tesztkészlet dokumentumaiból. Az előrejelzések alapján a rendszer kiszámítja a modell kiértékelési metrikáit . Javasoljuk, hogy győződjön meg arról, hogy az összes osztály megfelelően szerepel a betanítási és tesztelési csoportban.
Az egyéni szövegbesorolás két módszert támogat az adatok felosztásához:
- A tesztelési csoport automatikus felosztása betanítási adatokból: A rendszer a kiválasztott százalékos arányoknak megfelelően felosztja a címkézett adatokat a betanítási és tesztelési csoportok között. A rendszer megkísérli az összes osztály ábrázolását a betanítási csoportban. A javasolt százalékos felosztás 80% a betanításhoz és 20% teszteléshez.
Megjegyzés
Ha a tesztelési készlet automatikus felosztása a betanítási adatokból beállítást választja, csak a betanítási készlethez rendelt adatok lesznek felosztva a megadott százalékos értékek szerint.
- A betanítási és tesztelési adatok manuális felosztása: Ez a módszer lehetővé teszi a felhasználók számára, hogy meghatározzák, mely címkézett dokumentumok tartoznak a készlethez. Ez a lépés csak akkor engedélyezett, ha az adatok címkézése során dokumentumokat adott hozzá a tesztelési csoporthoz.
Modell betanítása
A modell betanításának megkezdése a Language Studióban:
A bal oldali menüben válassza a Betanítási feladatok lehetőséget.
A felső menüben válassza a Betanítási feladat indítása lehetőséget.
Válassza az Új modell betanítása lehetőséget, és írja be a modell nevét a szövegmezőbe. A meglévő modell felülírásához válassza ezt a lehetőséget, és válassza ki azt a modellt, amelyet felül szeretne írni a legördülő menüből. A betanított modellek felülírása visszafordíthatatlan, de az üzembe helyezett modellekre az új modell üzembe helyezéséig nem lesz hatással.
Válassza ki az adathasítási módszert. Választhatja a tesztelési csoport automatikus felosztását a betanítási adatokból , ahol a rendszer a megadott százalékok szerint felosztja a címkézett adatokat a betanítási és tesztelési csoportok között. Vagy használhatja a betanítási és tesztelési adatok manuális felosztását is, ez a beállítás csak akkor engedélyezett, ha az adatok címkézése során dokumentumokat adott hozzá a tesztelési csoporthoz. Az adatok felosztásával kapcsolatos további információkért lásd: Modell betanítása .
Válassza a Betanítása gombot.
Ha kiválasztja a betanítási feladat azonosítóját a listából, megjelenik egy oldalsó ablaktábla, ahol ellenőrizheti a betanítási folyamatot, a feladat állapotát és a feladat egyéb adatait.
Megjegyzés
- Csak a sikeres betanítási feladatok hoznak létre modelleket.
- A modell betanítása eltarthat néhány perc és több óra között a címkézett adatok méretétől függően.
- Egyszerre csak egy betanítási feladat futtatható. Amíg a futó feladat be nem fejeződik, nem lehet másik betanítási feladatot elindítani ugyanabban a projektben.
Betanítási feladat megszakítása
Ha le szeretne szakítani egy betanítási feladatot a Language Studióban, lépjen a Betanítási feladatok lapra. Válassza ki a megszakítani kívánt betanítási feladatot, majd a felső menüben válassza a Mégse lehetőséget.
Következő lépések
A betanítás befejezése után megtekintheti a modell teljesítményét , ha szükséges, javíthatja a modellt. Ha elégedett a modellel, üzembe helyezheti, és elérhetővé teheti a szöveg besorolásához.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: