Udostępnij za pośrednictwem


Szybki start: tworzenie, publikowanie i tłumaczenie za pomocą modeli niestandardowych

Translator to oparta na chmurze usługa neuronowego tłumaczenia maszynowego, która jest częścią rodziny usług Azure AI interfejsu API REST, który może być używany z dowolnym systemem operacyjnym. Translator obsługuje wiele produktów i usług firmy Microsoft używanych przez tysiące firm na całym świecie do wykonywania tłumaczenia języka i innych operacji związanych z językiem. W tym przewodniku Szybki start dowiesz się, jak tworzyć niestandardowe rozwiązania dla aplikacji we wszystkich obsługiwanych językach.

Wymagania wstępne

Do korzystania z portalu Custom Translator potrzebne są następujące zasoby:

  • Konto Microsoft

  • Subskrypcja platformy Azure — utwórz bezpłatnie

  • Po utworzeniu subskrypcji platformy Azure utwórz zasób usługi Translator w witrynie Azure Portal, aby uzyskać klucz i punkt końcowy. Po wdrożeniu wybierz pozycję Przejdź do zasobu.

    • Potrzebujesz klucza i punktu końcowego z zasobu, aby połączyć aplikację z usługą Translator. Wklej klucz i punkt końcowy do kodu w dalszej części przewodnika Szybki start. Te wartości można znaleźć na stronie Klucze i punkt końcowy witryny Azure Portal:

      Zrzut ekranu: klucze witryny Azure Portal i strona punktu końcowego.

Aby uzyskać więcej informacji, zobacz jak utworzyć zasób usługi Translator.

Niestandardowy portal usługi Translator

Po spełnieniu powyższych wymagań wstępnych zaloguj się do portalu Custom Translator , aby utworzyć obszary robocze, kompilować projekty, przekazywać pliki, szkolić modele i publikować rozwiązanie niestandardowe.

Możesz zapoznać się z omówieniem tłumaczenia i tłumaczenia niestandardowego, zapoznać się z poradami i obejrzeć film wideo z wprowadzeniem w blogu technicznym dotyczącym sztucznej inteligencji platformy Azure.

Podsumowanie procesu

  1. Utwórz obszar roboczy. Obszar roboczy to obszar roboczy do kompilowania i tworzenia niestandardowego systemu tłumaczenia. Obszar roboczy może zawierać wiele projektów, modeli i dokumentów. Wszystkie zadania wykonywane w usłudze Custom Translator są wykonywane w określonym obszarze roboczym.

  2. Utwórz projekt. Projekt to otoka modeli, dokumentów i testów. Każdy projekt zawiera wszystkie dokumenty przekazane do tego obszaru roboczego z prawidłową parą języków. Jeśli na przykład masz zarówno projekt angielski-hiszpański, jak i projekt hiszpański-angielski, te same dokumenty są zawarte w obu projektach.

  3. Przekazywanie dokumentów równoległych. Dokumenty równoległe to pary dokumentów, w których jeden (element docelowy) to tłumaczenie drugiego (źródło). Jeden dokument w parze zawiera zdania w języku źródłowym, a drugi dokument zawiera zdania przetłumaczone na język docelowy. Nie ma znaczenia, który język jest oznaczony jako "źródło" i który język jest oznaczony jako "docelowy" — równoległy dokument może służyć do trenowania systemu tłumaczenia w obu kierunkach.

  4. Trenowanie modelu. Model to system, który zapewnia tłumaczenie dla określonej pary językowej. Wynikiem pomyślnego trenowania jest model. Podczas trenowania modelu wymagane są trzy wzajemnie wykluczające się typy dokumentów: trenowanie, dostrajanie i testowanie. Jeśli podczas kolejkowania szkolenia są udostępniane tylko dane szkoleniowe, usługa Custom Translator automatycznie tworzy dostrajanie i testowanie danych. Używa losowego podzestawu zdań z dokumentów szkoleniowych i wyklucza te zdania z samych danych treningowych. 10 000 zdania równoległego jest minimalnym wymaganiem do wytrenowania modelu.

  5. Przetestuj model (ocenianie przez człowieka). Zestaw testów służy do obliczania wyniku BLEU . Ten wynik wskazuje jakość systemu tłumaczenia.

  6. Publikowanie (wdrażanie) wytrenowanego modelu. Model niestandardowy jest udostępniany dla żądań tłumaczenia w czasie wykonywania.

  7. Tłumaczenie tekstu. Użyj opartego na chmurze, bezpiecznego, wysokiej wydajności, wysoce skalowalnego interfejsu API tłumaczenia tekstu w usłudze Microsoft Translator w wersji 3 , aby wysyłać żądania tłumaczenia.

Tworzenie obszaru roboczego

  1. Po zalogowaniu się do usługi Custom Translator zostanie wyświetlony monit o pozwolenie na odczytanie profilu z Platforma tożsamości Microsoft żądania tokenu dostępu użytkownika i tokenu odświeżania. Oba tokeny są potrzebne do uwierzytelniania i aby upewnić się, że nie są wylogowane podczas sesji na żywo ani podczas trenowania modeli.
    Wybierz pozycję Tak.

    Zrzut ekranu przedstawiający sposób tworzenia obszaru roboczego.

  2. Wybierz pozycję Moje obszary robocze.

  3. Wybierz pozycję Utwórz nowy obszar roboczy.

  4. Wpisz Contoso MT models (Modele usługi Contoso MT) w polu Nazwa obszaru roboczego i wybierz przycisk Next (Dalej).

  5. Z listy rozwijanej wybierz pozycję "Globalny" dla pozycji Wybierz region zasobów.

  6. Skopiuj/wklej klucz usług Translator.

  7. Wybierz Dalej.

  8. Wybierz pozycję Gotowe.

    Uwaga

    Region musi być zgodny z regionem wybranym podczas tworzenia zasobu. Możesz użyć KLUCZA 1 lub KLUCZA 2.

    Zrzut ekranu przedstawiający klucz zasobu.

    Zrzut ekranu przedstawiający tworzenie obszaru roboczego.

Tworzenie projektu

Po pomyślnym utworzeniu obszaru roboczego przejdź do strony Projekty .

Utworzysz projekt angielski-niemiecki, aby wytrenować model niestandardowy tylko przy użyciu typu dokumentu szkoleniowego.

  1. Wybierz pozycję Utwórz projekt.

  2. W polu Nazwa projektu wpisz angielski-niemiecki.

  3. Wybierz pozycję Angielski (en) jako Język źródłowy z listy rozwijanej.

  4. Wybierz pozycję Niemiecki (de) jako język docelowy z listy rozwijanej.

  5. Z listy rozwijanej wybierz pozycję Ogólne dla pozycji Domena .

  6. Wybierz pozycję Utwórz projekt.

    Zrzut ekranu przedstawiający sposób tworzenia projektu.

Przekaż dokumenty

Aby utworzyć model niestandardowy, należy przekazać wszystkie lub kombinację typów dokumentów trenowania, dostrajania, testowania i słownika .

W tym przewodniku Szybki start przekażesz dokumenty szkoleniowe na potrzeby dostosowywania.

Uwaga

Na potrzeby tego przewodnika Szybki start możesz użyć naszego przykładowego zestawu danych trenowania, fraz i słowników zdań, przykładowego zestawu danych z języka angielskiego na język niemiecki. Jednak w przypadku środowiska produkcyjnego lepiej jest przekazać własny zestaw danych szkoleniowych.

  1. Wybierz nazwę projektu z języka angielskiego na niemiecki .

  2. Wybierz pozycję Zarządzaj dokumentami z menu nawigacji po lewej stronie.

  3. Wybierz pozycję Dodaj zestaw dokumentów.

  4. Zaznacz pole Zestaw trenowania i wybierz przycisk Dalej.

  5. Zachowaj zaznaczone dokumenty równoległe i wpisz sample-english-german.

  6. W pliku Źródłowy (angielski — EN) wybierz pozycję Przeglądaj pliki i wybierz pozycję sample-English-German-Training-en.txt.

  7. W obszarze Plik docelowy (niemiecki — EN) wybierz pozycję Przeglądaj pliki i wybierz pozycję sample-English-German-Training-de.txt.

  8. Wybierz pozycję Przekaż

    Uwaga

    Przykładowy zestaw danych słowników i słowników zdań można przekazać. Ten krok jest pozostawiony do ukończenia.

    Zrzut ekranu przedstawiający sposób przekazywania dokumentów.

Szkolenie modelu

Teraz możesz wytrenować model z języka angielskiego na niemiecki.

  1. Wybierz pozycję Train model (Trenowanie modelu ) z menu nawigacji po lewej stronie.

  2. Wpisz en-de z przykładowymi danymi w polu Nazwa modelu.

  3. Zachowaj sprawdzanie pełnego szkolenia .

  4. W obszarze Wybierz dokumenty sprawdź przykładowy język angielski-niemiecki i przejrzyj koszt szkolenia skojarzony z wybraną liczbą zdań.

  5. Wybierz pozycję Trenuj teraz.

  6. Wybierz pozycję Trenuj , aby potwierdzić.

    Uwaga

    Powiadomienia wyświetla trenowanie modelu w toku, np. Przesyłanie stanu danych. Model trenowania trwa kilka godzin, z zastrzeżeniem liczby wybranych zdań.

    Zrzut ekranu przedstawiający sposób tworzenia modelu.

  7. Po pomyślnym trenowaniu modelu wybierz pozycję Szczegóły modelu z menu nawigacji po lewej stronie.

  8. Wybierz nazwę modelu en-de z przykładowymi danymi. Przejrzyj datę/godzinę trenowania, łączny czas trenowania, liczbę zdań używanych do trenowania, dostrajania, testowania i słownika. Sprawdź, czy system wygenerował zestaw testów i dostrajania. Użyj polecenia Category ID , aby wysyłać żądania tłumaczenia.

  9. Oceń wynik BLEU modelu. Wynik BLEU zestawu testów to niestandardowy wynik modelu, a model bazowy BLEU to wstępnie wytrenowany model bazowy używany do dostosowywania. Wyższa ocena BLEU oznacza wyższą jakość tłumaczenia przy użyciu modelu niestandardowego.

    Uwaga

    Jeśli trenujesz przy użyciu naszych udostępnionych przykładowych zestawów danych klienta, wynik BLEU będzie inny niż obraz.

    Zrzut ekranu przedstawiający szczegóły modelu.

Testowanie modelu

Po pomyślnym zakończeniu trenowania sprawdź przetłumaczone zdania zestawu testów.

  1. Wybierz pozycję Test model z menu nawigacji po lewej stronie.
  2. Wybierz pozycję "en-de with sample data" (En-de z przykładowymi danymi)
  3. Ocena tłumaczenia przez człowieka z nowego modelu (modelu niestandardowego) i modelu linii bazowej (nasz wstępnie wytrenowany punkt odniesienia używany do dostosowywania) względem odwołania (tłumaczenie docelowe z zestawu testowego)

Publikowanie modelu

Opublikowanie modelu udostępnia go do użycia w interfejsie API usługi Translator. Projekt może zawierać jeden lub wiele pomyślnie wytrenowanych modeli. Można opublikować tylko jeden model na projekt. Można jednak opublikować model w jednym lub wielu regionach w zależności od potrzeb. Aby uzyskać więcej informacji, zobacz Cennik usługi Translator.

  1. Wybierz pozycję Publikuj model z menu nawigacji po lewej stronie.

  2. Wybierz pozycję en-de z przykładowymi danymi i wybierz pozycję Publikuj.

  3. Sprawdź żądane regiony.

  4. Wybierz Publikuj. Stan powinien przejść z Deploying to Deployed (Wdrażanie) do Deployed (Wdrożone).

    Zrzut ekranu przedstawiający sposób wdrażania wytrenowanego modelu.

Tłumaczenie tekstu

  1. Deweloperzy powinni używać żądań tłumaczenia przy użyciu interfejsu Category ID API tłumaczenia tekstu w usłudze Microsoft Translator w wersji 3. Więcej informacji na temat interfejsu API tłumaczenia tekstu w usłudze Translator można znaleźć na stronie internetowej z dokumentacją interfejsu API.

  2. Użytkownicy biznesowi mogą chcieć pobrać i zainstalować bezpłatną aplikację DocumentTranslator dla systemu Windows.

Następne kroki