Szybki start: kompilowanie, publikowanie i tłumaczenie za pomocą modeli niestandardowych

Translator to oparta na chmurze usługa neuronowego tłumaczenia maszynowego, która jest częścią rodziny usług AI platformy Azure interfejsu API REST, który może być używany z dowolnym systemem operacyjnym. Translator obsługuje wiele produktów i usług firmy Microsoft używanych przez tysiące firm na całym świecie do wykonywania tłumaczenia językowego i innych operacji związanych z językiem. W tym przewodniku Szybki start dowiesz się, jak tworzyć niestandardowe rozwiązania dla aplikacji we wszystkich obsługiwanych językach.

Wymagania wstępne

Aby korzystać z portalu Custom Translator , potrzebne są następujące zasoby:

  • Konto Microsoft

  • Subskrypcja platformy Azure — utwórz jedną bezpłatnie

  • Po utworzeniu subskrypcji platformy Azure utwórz zasób usługi Translator w Azure Portal, aby uzyskać klucz i punkt końcowy. Po wdrożeniu wybierz pozycję Przejdź do zasobu.

    • Potrzebujesz klucza i punktu końcowego z zasobu, aby połączyć aplikację z usługą Translator. Wklej klucz i punkt końcowy do kodu w dalszej części przewodnika Szybki start. Te wartości można znaleźć na stronie klucze Azure Portal i punkt końcowy:

      Zrzut ekranu: Azure Portal klucze i stronę punktu końcowego.

Aby uzyskać więcej informacji, zobaczjak utworzyć zasób usługi Translator.

Niestandardowy portal usługi Translator

Po spełnieniu powyższych wymagań wstępnych zaloguj się do portalu Custom Translator , aby utworzyć obszary robocze, tworzyć projekty, przekazywać pliki, trenować modele i publikować rozwiązanie niestandardowe.

Możesz zapoznać się z omówieniem tłumaczenia i tłumaczenia niestandardowego, zapoznać się z poradami i watch wideo z wprowadzeniem w blogu technicznym dotyczącym sztucznej inteligencji platformy Azure.

Podsumowanie procesu

  1. Utwórz obszar roboczy. Obszar roboczy jest obszarem roboczym do kompilowania i tworzenia niestandardowego systemu tłumaczenia. Obszar roboczy może zawierać wiele projektów, modeli i dokumentów. Wszystkie zadania wykonywane w usłudze Custom Translator są wykonywane w określonym obszarze roboczym.

  2. Utwórz projekt. Projekt jest otoką modeli, dokumentów i testów. Każdy projekt zawiera wszystkie dokumenty przekazane do tego obszaru roboczego z prawidłową parą języków. Jeśli na przykład masz zarówno projekt angielski-hiszpański, jak i projekt hiszpański-angielski, te same dokumenty są zawarte w obu projektach.

  3. Przekazywanie dokumentów równoległych. Dokumenty równoległe to pary dokumentów, w których jeden (element docelowy) jest tłumaczeniem drugiego (źródła). Jeden dokument w parze zawiera zdania w języku źródłowym, a drugi dokument zawiera zdania przetłumaczone na język docelowy. Nie ma znaczenia, który język jest oznaczony jako "źródło" i który język jest oznaczony jako "docelowy" — równoległy dokument może służyć do trenowania systemu tłumaczenia w obu kierunkach.

  4. Trenowanie modelu. Model to system, który zapewnia tłumaczenie dla określonej pary językowej. Wynikiem pomyślnego trenowania jest model. Podczas trenowania modelu wymagane są trzy wzajemnie wykluczające się typy dokumentów: trenowanie, dostrajanie i testowanie. Jeśli podczas kolejkowania szkolenia są udostępniane tylko dane szkoleniowe, usługa Custom Translator automatycznie gromadzi dane dostrajania i testowania. Używa losowego podzestawu zdań z dokumentów szkoleniowych i wyklucza te zdania z samych danych treningowych. 10 000 zdań równoległych jest minimalnym wymaganiem do trenowania modelu.

  5. Przetestuj model (ocena ludzka). Zestaw testów służy do obliczania wyniku BLEU . Ten wynik wskazuje jakość systemu tłumaczenia.

  6. Opublikuj (wdróż) wytrenowany model. Model niestandardowy jest udostępniany dla żądań tłumaczenia w czasie wykonywania.

  7. Tłumaczenie tekstu. Użyj opartego na chmurze, bezpiecznego, wysokiej wydajności, wysoce skalowalnego interfejsu API tłumaczenia tekstu w usłudze Microsoft Translator w wersji 3, aby wysyłać żądania tłumaczenia.

Tworzenie obszaru roboczego

  1. Po zalogowaniu się do usługi Custom Translator zostanie wyświetlony monit o pozwolenie na odczytanie profilu z Platforma tożsamości Microsoft żądania tokenu dostępu użytkownika i tokenu odświeżania. Oba tokeny są potrzebne do uwierzytelniania i aby upewnić się, że nie są wylogowane podczas sesji na żywo ani podczas trenowania modeli.
    Wybierz pozycję Tak.

    Zrzut ekranu przedstawiający sposób tworzenia obszaru roboczego.

  2. Wybierz pozycję Moje obszary robocze.

  3. Wybierz pozycję Utwórz nowy obszar roboczy.

  4. Wpisz contoso MT models for Workspace name ( Modele usługi Contoso MT ) w polu Nazwa obszaru roboczego i wybierz przycisk Dalej.

  5. Wybierz pozycję "Globalny" dla pozycji Wybierz region zasobów z listy rozwijanej.

  6. Skopiuj/wklej klucz usług Translator.

  7. Wybierz opcję Dalej.

  8. Kliknij Gotowe.

    Uwaga

    Region musi być zgodny z regionem wybranym podczas tworzenia zasobu. Możesz użyć klucza 1 lub KLUCZA 2.

    Zrzut ekranu przedstawiający klucz zasobu.

    Zrzut ekranu przedstawiający tworzenie obszaru roboczego.

Tworzenie projektu

Po pomyślnym utworzeniu obszaru roboczego przejdź do strony Projekty .

Utworzysz projekt z języka angielskiego na niemiecki, aby wytrenować model niestandardowy tylko przy użyciu typu dokumentu szkoleniowego .

  1. Wybierz pozycję Create project (Utwórz projekt).

  2. Wpisz english-to-german w polu Nazwa projektu.

  3. Wybierz pozycję Angielski (en) jako Język źródłowy z listy rozwijanej.

  4. Z listy rozwijanej wybierz pozycję Niemiecki (de) jako język docelowy .

  5. Wybierz pozycję Ogólne dla pozycji Domena z listy rozwijanej.

  6. Wybierz pozycję Create project (Utwórz projekt).

    Zrzut ekranu przedstawiający sposób tworzenia projektu.

Przekazywanie dokumentów

Aby utworzyć model niestandardowy, należy przekazać wszystkie lub kombinację typów dokumentów trenowania, dostrajania, testowania i słownika .

W tym przewodniku Szybki start przekażesz dokumenty szkoleniowe na potrzeby dostosowywania.

Uwaga

W tym przewodniku Szybki start możesz użyć naszego przykładowego zestawu danych trenowania, fraz i słowników zdań, przykładowego zestawu danych z języka angielskiego na niemiecki. Jednak w przypadku środowiska produkcyjnego lepiej jest przekazać własny zestaw danych treningowych.

  1. Wybierz pozycję Nazwa projektu z języka angielskiego na niemiecki .

  2. Wybierz pozycję Zarządzaj dokumentami z menu nawigacji po lewej stronie.

  3. Wybierz pozycję Dodaj zestaw dokumentów.

  4. Zaznacz pole Zestaw trenowania i wybierz przycisk Dalej.

  5. Zachowaj sprawdzanie dokumentów równoległych i wpisz sample-english-german.

  6. W pliku Source (English - EN) wybierz pozycję Przeglądaj pliki i wybierz pozycjęsample-English-German-Training-en.txt.

  7. W obszarze Docelowy (niemiecki — EN) wybierz pozycję Przeglądaj pliki i wybierz pozycjęsample-English-German-Training-de.txt.

  8. Wybierz pozycję Przekaż

    Uwaga

    Przykładowy zestaw danych słowników i słowników zdań można przekazać. Ten krok pozostaje do ukończenia.

    Zrzut ekranu przedstawiający sposób przekazywania dokumentów.

Szkolenie modelu

Teraz możesz wytrenować model angielski-niemiecki.

  1. Wybierz pozycję Train model (Trenowanie modelu ) z menu nawigacji po lewej stronie.

  2. Wpisz en-de z przykładowymi danymiw polu Nazwa modelu.

  3. Zachowaj pełne sprawdzanie trenowania .

  4. W obszarze Wybierz dokumenty sprawdź przykładowy język angielski-niemiecki i przejrzyj koszt szkolenia skojarzony z wybraną liczbą zdań.

  5. Wybierz pozycję Trenuj teraz.

  6. Wybierz pozycję Trenuj , aby potwierdzić.

    Uwaga

    Powiadomienia wyświetla trenowanie modelu w toku, np. Przesyłanie stanu danych . Model trenowania trwa kilka godzin, z zastrzeżeniem liczby wybranych zdań.

    Zrzut ekranu przedstawiający sposób tworzenia modelu.

  7. Po pomyślnym trenowaniu modelu wybierz pozycję Szczegóły modelu z menu nawigacji po lewej stronie.

  8. Wybierz nazwę modelu en-de z przykładowymi danymi. Przejrzyj datę/godzinę trenowania, łączny czas trenowania, liczbę zdań używanych do trenowania, dostrajania, testowania i słownika. Sprawdź, czy system wygenerował zestawy testów i dostrajania. Element służy Category ID do tworzenia żądań tłumaczenia.

  9. Ocena wyniku BLEU modelu. Wynik BLEU zestawu testów to niestandardowy wynik modelu, a punkt odniesienia BLEU to wstępnie wytrenowany model bazowy używany do dostosowywania. Wyższy wynik BLEU oznacza wyższą jakość tłumaczenia przy użyciu modelu niestandardowego.

    Uwaga

    Jeśli trenujesz przy użyciu naszych udostępnionych zestawów danych przykładowych klientów, wynik BLEU będzie inny niż obraz.

    Zrzut ekranu przedstawiający szczegóły modelu.

Testowanie modelu

Po pomyślnym zakończeniu trenowania sprawdź przetłumaczone zdania zestawu testowego.

  1. Wybierz pozycję Test model z menu nawigacji po lewej stronie.
  2. Wybierz pozycję "en-de with sample data" (En-de z przykładowymi danymi)
  3. Ocena przez człowieka tłumaczenia z nowego modelu (modelu niestandardowego) i modelu linii bazowej (nasz wstępnie wytrenowany punkt odniesienia używany do dostosowywania) względem odwołania (tłumaczenie docelowe z zestawu testowego)

Publikowanie modelu

Opublikowanie modelu udostępnia go do użycia w interfejsie API usługi Translator. Projekt może zawierać jeden lub wiele pomyślnie wytrenowanych modeli. Można opublikować tylko jeden model na projekt. Można jednak opublikować model w jednym lub wielu regionach w zależności od potrzeb. Aby uzyskać więcej informacji, zobacz Cennik usługi Translator.

  1. Wybierz pozycję Publikuj model z menu nawigacji po lewej stronie.

  2. Wybierz pozycję en-de z przykładowymi danymi i wybierz pozycję Publikuj.

  3. Sprawdź żądane regiony.

  4. Kliknij pozycję Opublikuj. Stan powinien przejść z Deploying to Deployed (Wdrażanie) na Deployed (Wdrożone).

    Zrzut ekranu przedstawiający sposób wdrażania wytrenowanego modelu.

Tłumaczenie tekstu

  1. Deweloperzy powinni używać funkcji podczas wykonywania żądań tłumaczenia za pomocą interfejsu Category ID API tłumaczenia tekstu w usłudze Microsoft Translator w wersji 3. Więcej informacji na temat interfejsu API tłumaczenia tekstu w usłudze Translator można znaleźć na stronie internetowej z dokumentacją interfejsu API.

  2. Użytkownicy biznesowi mogą chcieć pobrać i zainstalować bezpłatną aplikację DocumentTranslator dla systemu Windows.

Następne kroki