Sdílet prostřednictvím


Trénování modelu pracovního postupu orchestrace

Trénování je proces, při kterém se model učí z označených promluv. Po dokončení trénování budete moct zobrazit výkon modelu.

Pokud chcete vytrénovat model, spusťte trénovací úlohu. Model vytvoří pouze úspěšně dokončené úlohy. Platnost trénovacích úloh vyprší po sedmi dnech, po této době už nebudete moct načíst podrobnosti o úloze. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, vypršení platnosti úlohy na ni nebude mít vliv. Najednou můžete mít spuštěnou jenom jednu úlohu trénování a nemůžete spustit jiné úlohy ve stejném projektu.

Doba trénování může být od několika sekund při práci s jednoduchými projekty až po několik hodin, kdy dosáhnete maximálního limitu promluv.

Vyhodnocení modelu se aktivuje automaticky po úspěšném dokončení trénování. Proces vyhodnocení začíná použitím natrénovaného modelu ke spouštění predikcí promluv v testovací sadě a porovnává předpovězené výsledky se zadanými popisky (které stanoví základní hodnoty pravdivosti). Výsledky se vrátí, abyste mohli zkontrolovat výkon modelu.

Požadavky

  • Úspěšně vytvořený projekt s nakonfigurovaným účtem úložiště objektů blob v Azure

Další informace najdete v tématu Životní cyklus vývoje projektu .

Rozdělování dat

Než začnete s procesem trénování, jsou označené promluvy ve vašem projektu rozdělené na trénovací sadu a testovací sadu. Každá z nich má jinou funkci. Trénovací sada se používá při trénování modelu. Jedná se o sadu, ze které se model učí označené promluvy. Testovací sada je sada nevidomých, která se do modelu nezavádí během trénování, ale pouze během vyhodnocení.

Po úspěšném natrénování modelu je možné ho použít k předpovědím z promluv v testovací sadě. Tyto předpovědi se používají k výpočtu metrik vyhodnocení.

Doporučujeme zajistit, aby všechny vaše záměry byly adekvátně zastoupeny v trénovací i testovací sadě.

Pracovní postup orchestrace podporuje dvě metody rozdělení dat:

  • Automatické rozdělení testovací sady od trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sadu podle zvolených procent. Doporučené procento rozdělení je 80 % pro trénování a 20 % pro testování.

Poznámka

Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent pouze data přiřazená k trénovací sadě.

  • Použití ručního rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které promluvy mají patřit do které sady. Tento krok je povolený jenom v případě, že jste během označování přidali do testovací sady promluvy.

Poznámka

Do trénovací datové sady můžete přidávat výroky jenom pro nespojované záměry.

Trénování modelu

Spustit trénovací úlohu

Pokud chcete začít s trénováním modelu v sadě Language Studio:

  1. V nabídce na levé straně vyberte Trénovací úlohy .

  2. V horní nabídce vyberte Spustit trénovací úlohu .

  3. Vyberte Trénování nového modelu a do textového pole zadejte název modelu. Existující model můžete také přepsat tak, že vyberete tuto možnost a v rozevírací nabídce zvolíte model, který chcete přepsat. Přepsání natrénovaného modelu je nevratné, ale nasazené modely neovlivní, dokud nový model nenasadíte.

    Pokud jste v projektu povolili ruční rozdělení dat při označování promluv, zobrazí se dvě možnosti rozdělení dat:

    • Automatické rozdělení testovací sady od trénovacích dat: Označené promluvy se náhodně rozdělí mezi trénovací a testovací sadu podle toho, kolik procent zvolíte. Výchozí procentuální rozdělení je 80 % pro trénování a 20 % pro testování. Pokud chcete tyto hodnoty změnit, zvolte sadu, kterou chcete změnit, a zadejte novou hodnotu.

    Poznámka

    Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent jenom promluvy ve vaší trénovací sadě.

    • Použití ručního rozdělení trénovacích a testovacích dat: Přiřaďte každou promluvu buď k trénovací , nebo testovací sadě během kroku označování projektu.

    Poznámka

    Možnost ručního rozdělení trénovacích a testovacích dat se povolí jenom v případě, že do testovací sady na stránce dat značek přidáte promluvy. V opačném případě bude zakázán.

    Snímek obrazovky zobrazující stránku modelu trénování pro projekty pro porozumění konverzačnímu jazyku

  4. Vyberte tlačítko Train (Trénovat).

Poznámka

  • Modely budou generovat pouze úspěšně dokončené trénovací úlohy.
  • Trénování může na základě velikosti označených dat nějakou dobu trvat několik minut až několik hodin.
  • Najednou můžete mít spuštěnou pouze jednu úlohu trénování. Nelze spustit jinou úlohu trénování se stejným projektem, dokud se spuštěná úloha nedokončí.

Získání stavu trénovací úlohy

V seznamu vyberte ID trénovací úlohy. Zobrazí se boční podokno, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti pro tuto úlohu.

Zrušit trénovací úlohu

Pokud chcete zrušit úlohu trénování v nástroji Language Studio, přejděte na stránku Trénování modelu . Vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .

Další kroky