Sdílet prostřednictvím


Trénování vlastního modelu klasifikace textu

Trénování je proces, při kterém se model učí z označených dat. Po dokončení trénování budete moct zobrazit výkon modelu a určit, jestli potřebujete model vylepšit.

Pokud chcete vytrénovat model, spusťte trénovací úlohu. Použitelný model vytvoří pouze úspěšně dokončené úlohy. Trénovací úlohy vyprší po sedmi dnech. Po uplynutí této doby nebudete moct načíst podrobnosti o úloze. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, vypršení platnosti úlohy na ni nebude mít vliv. Současně můžete mít spuštěnou jenom jednu trénovací úlohu a nemůžete spustit další úlohy ve stejném projektu.

Doba trénování může trvat od několika minut při práci s několika dokumenty až několik hodin v závislosti na velikosti datové sady a složitosti schématu.

Požadavky

Před trénování modelu potřebujete:

Další informace najdete v tématu Životní cyklus vývoje projektu .

Rozdělování dat

Před zahájením trénování jsou označené dokumenty v projektu rozdělené na trénovací sadu a testovací sadu. Každý z nich má jinou funkci. Trénovací sada se používá při trénování modelu. Jedná se o sadu, ze které se model učí o třídě nebo třídách přiřazených k jednotlivým dokumentům. Testovací sada je sada nevidomých, která se do modelu nezavádí během trénování, ale pouze během vyhodnocení. Po úspěšném natrénování se model použije k vytváření predikcí z dokumentů v testovací sadě. Na základě těchto předpovědí se budou počítat metriky vyhodnocení modelu. Doporučujeme zajistit, aby všechny vaše třídy byly adekvátně zastoupeny v trénovací i testovací sadě.

Vlastní klasifikace textu podporuje dvě metody rozdělení dat:

  • Automatické rozdělení testovací sady od trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sadu podle zvolených procent. Systém se pokusí mít reprezentaci všech tříd ve vaší trénovací sadě. Doporučené procentuální rozdělení je 80 % pro trénování a 20 % pro testování.

Poznámka

Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent pouze data přiřazená k trénovací sadě.

  • Použití ručního rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které označené dokumenty mají patřit do které sady. Tento krok je povolený jenom v případě, že jste během označování dat přidali dokumenty do testovací sady.

Trénování modelu

Zahájení trénování modelu v nástroji Language Studio:

  1. V nabídce vlevo vyberte Trénovací úlohy .

  2. V horní nabídce vyberte Spustit trénovací úlohu .

  3. Vyberte Trénovat nový model a do textového pole zadejte název modelu. Existující model můžete také přepsat tak, že vyberete tuto možnost a v rozevírací nabídce vyberete model, který chcete přepsat. Přepsání natrénovaného modelu je nevratné, ale nasazené modely to neovlivní, dokud nový model nenasadíte.

    Vytvoření nové trénovací úlohy

  4. Vyberte metodu dělení dat. Můžete zvolit automatické rozdělení testovací sady od trénovacích dat , kdy systém rozdělí označená data mezi trénovací a testovací sadu podle zadaných procent. Nebo můžete použít ruční rozdělení trénovacích a testovacích dat. Tato možnost je povolená jenom v případě, že jste během označování dat přidali do testovací sady dokumenty. Další informace o rozdělení dat najdete v tématu Postup trénování modelu .

  5. Vyberte tlačítko Trénovat .

  6. Pokud ze seznamu vyberete ID trénovací úlohy, zobrazí se boční podokno, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti pro tuto úlohu.

    Poznámka

    • Modely budou generovat pouze úspěšně dokončené úlohy trénování.
    • Trénování modelu může trvat od několika minut do několika hodin na základě velikosti označených dat.
    • Najednou můžete mít spuštěnou pouze jednu úlohu trénování. V rámci stejného projektu nemůžete spustit další úlohu trénování, dokud se nedokončí spuštěná úloha.

Zrušit trénovací úlohu

Pokud chcete zrušit trénovací úlohu v nástroji Language Studio, přejděte na stránku Školicí úlohy . Vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .

Další kroky

Po dokončení trénování budete moct zobrazit výkon modelu a v případě potřeby model volitelně vylepšit. Jakmile budete s modelem spokojeni, můžete ho nasadit a zpřístupnit ho pro klasifikaci textu.