Kompilowanie dokumentów szkoleniowych i zarządzanie nimi
Usługa Custom Translator umożliwia tworzenie modeli tłumaczenia, które odzwierciedlają twoją biznesową, branżową i specyficzną dla domeny terminologię i styl. Trenowanie i wdrażanie modelu niestandardowego jest łatwe i nie wymaga żadnych umiejętności programistycznych. Usługa Custom Translator umożliwia przekazywanie plików równoległych, plików pamięci tłumaczenia lub plików zip.
Dokumenty równoległe to pary dokumentów, w których jeden (element docelowy) jest tłumaczeniem drugiego (źródła). Jeden dokument w parze zawiera zdania w języku źródłowym, a drugi dokument zawiera zdania przetłumaczone na język docelowy.
Przed przekazaniem dokumentów przejrzyj wskazówki dotyczące formatów dokumentów i konwencji nazewnictwa , aby upewnić się, że format pliku jest obsługiwany przez usługę Custom Translator.
Jak tworzyć zestawy dokumentów
Znajdowanie danych jakości w domenie jest często trudnym zadaniem, które różni się w zależności od klasyfikacji użytkowników. Poniżej przedstawiono kilka pytań, które możesz zadać sobie podczas oceniania, jakie dane mogą być dostępne dla Ciebie:
Przedsiębiorstwa często mają mnóstwo danych tłumaczenia, które zgromadziły się przez wiele lat przy użyciu tłumaczeń ludzkich. Czy firma ma dostępne poprzednie dane tłumaczenia?
Czy masz ogromną ilość monolingualnych danych? Monolingual data to dane tylko w jednym języku. Jeśli tak, czy możesz uzyskać tłumaczenia dla tych danych?
Czy można przeszukiwać portale online w celu zbierania zdań źródłowych i syntetyzowania zdań docelowych?
Materiały szkoleniowe dla poszczególnych typów dokumentów
Element źródłowy | Wyniki działania | Reguły do naśladowania |
---|---|---|
Dokumenty szkoleniowe dwujęzyczne | Uczy systemu terminologii i stylu. | Bądź liberalny. Każde tłumaczenie ludzkie w domenie jest lepsze niż tłumaczenie maszynowe. Dodaj i usuń dokumenty podczas pracy i spróbuj poprawić wynik BLEU. |
Dostrajanie dokumentów | Trenuje parametry neuronowego tłumaczenia maszynowego. | Bądź rygorystyczny. Utwórz je, aby być optymalnie reprezentatywnym dla tego, co zamierzasz tłumaczyć w przyszłości. |
Testowanie dokumentów | Oblicz wynik BLEU. | Bądź rygorystyczny. Utwórz dokumenty testowe, aby być optymalnie reprezentatywne dla tego, co planujesz przetłumaczyć w przyszłości. |
Słownik fraz | Wymusza tłumaczenie przez 100% czasu. | Bądź restrykcyjny. Słownik fraz jest uwzględniany w wielkości liter, a dowolne wyrazy lub frazy są tłumaczone w sposób określony przez Użytkownika. W wielu przypadkach lepiej nie używać słownika fraz i pozwolić systemowi się uczyć. |
Słownik zdań | Wymusza tłumaczenie przez 100% czasu. | Bądź rygorystyczny. Słownik zdań jest niewrażliwy na wielkość liter i jest dobry dla wspólnych w krótkich zdaniach domeny. Aby wystąpiło dopasowanie słownika zdań, całe przesłane zdanie musi być zgodne z wpisem słownika źródłowego. Jeśli tylko część zdania jest zgodna, wpis nie będzie zgodny. |
Jak przekazać dokumenty
Typy dokumentów są skojarzone z parą języków wybraną podczas tworzenia projektu.
Logowanie się do portalu usługi Custom Translator . Zostanie załadowany domyślny obszar roboczy, a zostanie wyświetlona lista wcześniej utworzonych projektów.
Wybierz żądaną nazwę projektu. Domyślnie jest zaznaczony blok Zarządzaj dokumentami , a zostanie wyświetlona lista wcześniej przekazanych dokumentów.
Wybierz pozycję Dodaj zestaw dokumentów i wybierz typ dokumentu:
- Zestaw treningowy
- Zestaw testów
- Zestaw dostrajania
- Zestaw słowników:
- Słownik fraz
- Słownik zdań
Wybierz opcję Dalej.
Uwaga
Wybranie pozycji Zestaw słowników uruchamia okno dialogowe Wybieranie typu słownika . Wybierz jeden i wybierz pozycję Dalej
Wybierz format dokumentów z przycisków radiowych.
- W obszarze Dokumenty równoległe wypełnij
Document set name
pola i wybierz pozycję Przeglądaj pliki , aby wybrać dokumenty źródłowe i docelowe. - W polu Plik pamięci tłumaczenia (TM) lub Przekaż wiele zestawów z plikiem ZIP wybierz pozycję Przeglądaj pliki , aby wybrać plik
- W obszarze Dokumenty równoległe wypełnij
Wybierz pozycję Przekaż.
W tym momencie usługa Custom Translator przetwarza dokumenty i próbuje wyodrębnić zdania wskazane w powiadomieniu o przekazaniu. Po zakończeniu przetwarzania zobaczysz powiadomienie o pomyślnym przekazaniu.
Wyświetlanie historii przekazywania
Na stronie obszaru roboczego można wyświetlić historię wszystkich dokumentów przekazywanych szczegółów, takich jak typ dokumentu, para języków, stan przekazywania itp.
Na stronie obszaru roboczego portalu Custom Translator kliknij kartę Przekazywanie historii, aby wyświetlić historię.
Na tej stronie jest wyświetlany stan wszystkich poprzednich przekazań. Wyświetla on przekazywanie z najnowszych do najnowszych. Dla każdego przekazywania jest wyświetlana nazwa dokumentu, stan przekazywania, data przekazania, liczba przekazanych plików, typ przekazanego pliku, para językowa pliku i utworzona przez nią. Filtr umożliwia szybkie znajdowanie dokumentów według nazwy, stanu, języka i zakresu dat.
Wybierz dowolny rekord historii przekazywania. Na stronie szczegółów historii przekazywania można wyświetlić pliki przekazane w ramach przekazywania, przekazanego stanu pliku, języka pliku i komunikatu o błędzie (jeśli wystąpił błąd podczas przekazywania).
Następne kroki
- Dowiedz się , jak trenować model.
- Dowiedz się , jak testować i oceniać jakość modelu.
- Dowiedz się , jak opublikować model.
- Dowiedz się , jak tłumaczyć za pomocą modeli niestandardowych.