Trénování vlastního modelu

Model poskytuje překlady pro konkrétní jazykovou dvojici. Výsledkem úspěšného trénování je model. K trénování vlastního modelu se vyžadují tři vzájemně se vylučující typy dokumentů: trénování, ladění a testování. Pokud jsou při řazení trénování do fronty k dispozici pouze trénovací data, Custom Translator automaticky sestaví data pro ladění a testování. Použije náhodnou podmnožinu vět z trénovacích dokumentů a vyloučí tyto věty ze samotných trénovacích dat. K trénování úplného modelu se vyžaduje minimálně 10 000 paralelních trénovacích vět.

Vytvoření modelu

  1. Vyberte okno Trénování modelu .

  2. Zadejte název modelu.

  3. Nechte vybranou výchozí možnost Úplné trénování nebo vyberte Trénování jen pro slovník.

    Poznámka

    Úplné trénování zobrazí všechny nahrané typy dokumentů. Pouze slovník zobrazuje pouze dokumenty slovníku.

  4. V části Vybrat dokumenty vyberte například dokumenty, které chcete použít k trénování modelu, sample-English-German a zkontrolujte náklady na trénování spojené s vybraným počtem vět.

  5. Vyberte Trénovat.

  6. Potvrďte ho výběrem možnosti Train (Trénovat ).

    Poznámka

    Oznámení zobrazují probíhající trénování modelu, například odeslání stavu dat . Trénovací model trvá několik hodin a závisí na počtu vybraných vět.

    Snímek obrazovky znázorňující okno trénování modelu

Kdy vybrat trénování jen pro slovník

Pro dosažení lepších výsledků doporučujeme nechat systém učit se z tréninkových dat. Pokud však nemáte dostatek paralelních vět ke splnění minimálních požadavků 10 000 nebo věty a složená podstatná jména musí být vykreslena tak, jak jsou, použijte trénování pouze pro slovník. Model obvykle dokončí trénování mnohem rychleji než v případě úplného trénováním. Výsledné modely použijí základní modely pro překlad spolu se slovníky, které jste přidali. Nezobrazí se skóre BLEU ani nedostanete sestavu testu.

Poznámka

Custom Translator nepáruje slovníkové soubory po větách. Proto je důležité, aby ve slovníkových dokumentech byl stejný počet zdrojových a cílových frází/vět a aby si přesně odpovídaly. Pokud tomu tak není, nahrávání dokumentů se nezdaří.

Podrobnosti o modelu

  1. Po úspěšném trénování modelu vyberte okno Podrobnosti modelu .

  2. Vyberte Název modelu a zkontrolujte datum a čas trénování, celkovou dobu trénování, počet vět použitých pro trénování, ladění, testování, slovník a to, jestli systém vygeneroval testovací a ladicí sady. Použijete Category ID k vytváření žádostí o překlad.

  3. Vyhodnoťte skóre BLEU modelu. Zkontrolujte testovací sadu: skóre BLEU je skóre vlastního modelu a BLEU směrného plánu je předem natrénovaný model směrného plánu, který se používá k přizpůsobení. Vyšší skóre BLEU znamená vyšší kvalitu překladu pomocí vlastního modelu.

    Snímek obrazovky znázorňující pole podrobností modelu

Duplicitní model

  1. Vyberte okno Podrobnosti modelu .

  2. Najeďte myší na název modelu a zaškrtněte tlačítko pro výběr.

  3. Vyberte Duplikovat.

  4. Vyplňte Název nového modelu.

  5. Pokud nebudou vybrána nebo nahrána žádná další data, ponechte možnost Train okamžitě zaškrtnutou. V opačném případě zaškrtněte políčko Uložit jako koncept.

  6. Vyberte Uložit.

    Poznámka

    Pokud model uložíte jako Draft, podrobnosti o modelu se aktualizují o název modelu ve Draft stavu.

    Pokud chcete přidat další dokumenty, vyberte název modelu a postupujte podle výše uvedené Create model části.

    Snímek obrazovky znázorňující okno duplicitního modelu

Další kroky