Co jsou trénování a modelování?
Model je systém, který poskytuje překlad pro konkrétní dvojici jazyků. Výsledkem úspěšného trénování je model. K trénování modelu se vyžadují tři vzájemně se vylučující typy dokumentů: trénování, ladění a testování. Lze také zadat typ dokumentu slovníku. Další informace najdete v tématu Zarovnání vět.
Pokud jsou při řazení trénování do fronty k dispozici pouze trénovací data, služba Custom Translator automaticky sestaví ladění a testování dat. Používá náhodnou podmnožinu vět z trénovacích dokumentů a vyloučí tyto věty ze samotných trénovacích dat.
Typ trénovacího dokumentu pro Custom Translator
Dokumenty zahrnuté v trénovací sadě používá služba Custom Translator jako základ pro vytvoření modelu. Během trénování se věty, které jsou přítomné v těchto dokumentech, zarovnávají (nebo spárují). Můžete si vzít svobodu při vytváření vaší sady školicích dokumentů. Do jednoho modelu můžete zahrnout dokumenty, u které se domníváte, že mají tangenciální význam. Opět je vyloučíte v jiném, abyste viděli dopad ve skóre BLEU (Bilingual Evaluation Understudy). Pokud budete udržovat sadu ladění a testovací sadu konstantní, můžete experimentovat se složením trénovací sady. Tento přístup představuje efektivní způsob, jak upravit kvalitu systému překladu.
V rámci projektu můžete spustit více trénování a porovnat skóre BLEU napříč všemi trénovacími běhy . Při spouštění více trénování pro porovnání se ujistěte, že se pokaždé zadává stejné ladění a testovací data. Nezapomeňte také výsledky zkontrolovat ručně na kartě Testování .
Ladění typu dokumentu pro Custom Translator
Paralelní dokumenty zahrnuté v této sadě používají služba Custom Translator k ladění systému překladu pro optimální výsledky.
Při trénování se data ladění používají k úpravě všech parametrů a hmotností systému překladu na optimální hodnoty. Pečlivě si vyberte data ladění: Data ladění by měla být reprezentativním obsahem dokumentů, které chcete v budoucnu přeložit. Data ladění mají velký vliv na kvalitu vytvořených překladů. Ladění umožňuje systému překladu poskytovat překlady, které jsou nejblíže ukázkám, které zadáte v datech ladění. V tuningových datech nepotřebujete víc než 2 500 vět. Pro optimální kvalitu překladu doporučujeme vybrat sadu ladění ručně výběrem nejvýraznějšího výběru vět.
Při vytváření sady ladění zvolte věty, které mají smysluplnou a reprezentativní délku budoucích vět, které očekáváte přeložit. Zvolte věty, které obsahují slova a fráze, které chcete přeložit v přibližném rozdělení, které očekáváte v budoucích překladech. V praxi má délka věty 7 až 10 slov nejlepší výsledky. Tyto věty obsahují dostatečný kontext k zobrazení inflexní a poskytují délku fráze, která je významná, aniž by byla příliš složitá.
Dobrým popisem typu vět, které se mají použít v ladicí sadě, je prose: skutečné fluentní věty. Ne buňky tabulky, ne básně, ne seznamy věcí, nejen interpunkce nebo čísla ve větě – běžný jazyk.
Pokud data ladění vyberete ručně, neměla by mít žádná ze stejných vět jako trénovací a testovací data. Data ladění mají významný dopad na kvalitu překladů – pečlivě zvolte věty.
Pokud si nejste jistí, co si vybrat pro vaše tuningová data, stačí vybrat trénovací data a nechat Custom Translator vybrat data ladění za vás. Když službě Custom Translator necháte zvolit data ladění automaticky, použije náhodnou podmnožinu vět z vašich dvoujazyčných trénovacích dokumentů a vyloučí tyto věty ze samotného trénovacího materiálu.
Testování datové sady pro Custom Translator
Paralelní dokumenty zahrnuté v testovací sadě se používají k výpočtu skóre BLEU (Bilingual Evaluation Understudy). Toto skóre označuje kvalitu vašeho systému překladu. Toto skóre vám ve skutečnosti říká, jak přesně překlady provedené systémem překladů vyplývající z tohoto trénování odpovídají referenční větám v testovací sadě dat.
Skóre BLEU je měření rozdílu mezi automatickým překladem a referenčním překladem. Jeho hodnota se pohybuje od 0 do 100. Skóre 0 označuje, že v překladu se nezobrazuje jediné slovo odkazu. Skóre 100 označuje, že automatický překlad přesně odpovídá odkazu: stejné slovo je ve stejné pozici. Skóre, které obdržíte, je průměr skóre BLEU pro všechny věty testovacích dat.
Testovací data by měla obsahovat paralelní dokumenty, ve kterých jsou věty cílového jazyka nejžádanějšími překlady odpovídajících vět zdrojového jazyka ve zdrojovém cílovém páru. Možná budete chtít použít stejná kritéria, která jste použili k vytvoření dat ladění. Testovací data však nemají žádný vliv na kvalitu systému překladu a používají se výhradně k vygenerování skóre BLEU za vás.
Jako testovací data nepotřebujete víc než 2 500 vět. Když necháte systém zvolit testovací sadu automaticky, použije náhodnou podmnožinu vět z vašich dvoujazyčných trénovacích dokumentů a vyloučí tyto věty ze samotného trénovacího materiálu.
Můžete zobrazit vlastní překlady testovací sady a porovnat je s překlady, které jste zadali v testovací sadě, tak, že přejdete na kartu testu v rámci modelu.