Trenowanie modelu interpretacji języka konwersacyjnego

Po zakończeniu etykietowania wypowiedzi możesz rozpocząć trenowanie modelu. Trenowanie to proces, w którym model uczy się na podstawie oznaczonych wypowiedzi.

Aby wytrenować model, uruchom zadanie szkoleniowe. Tylko pomyślnie ukończone zadania tworzą model. Zadania szkoleniowe wygasają po siedmiu dniach, po tym czasie nie będzie już można pobrać szczegółów zadania. Jeśli zadanie trenowania zostało ukończone pomyślnie, a model został utworzony, nie będzie to miało wpływu na wygaśnięcie zadania. Możesz mieć tylko jedno zadanie szkoleniowe uruchomione jednocześnie i nie można uruchomić innych zadań w tym samym projekcie.

Czas trenowania może być w dowolnym miejscu od kilku sekund podczas pracy z prostymi projektami, do kilku godzin, gdy osiągniesz maksymalny limit wypowiedzi.

Ocena modelu jest wyzwalana automatycznie po pomyślnym zakończeniu trenowania. Proces oceny rozpoczyna się przy użyciu wytrenowanego modelu do uruchamiania przewidywań na wypowiedziach w zestawie testów i porównuje przewidywane wyniki z podanymi etykietami (co ustanawia punkt odniesienia prawdy).

Wymagania wstępne

Dzielenie danych

Przed rozpoczęciem procesu trenowania oznaczone wypowiedziami w projekcie są podzielone na zestaw treningowy i zestaw testów. Każdy z nich pełni inną funkcję. Zestaw trenowania jest używany w trenowaniu modelu. Jest to zestaw, z którego model uczy się oznaczonych wypowiedzi. Zestaw testów to zestaw niewidomy, który nie jest wprowadzany do modelu podczas trenowania, ale tylko podczas oceny.

Po pomyślnym wytrenowanym modelu model może służyć do przewidywania z wypowiedzi w zestawie testów. Te przewidywania służą do obliczania metryk oceny. Zaleca się upewnienie się, że wszystkie intencje i jednostki są odpowiednio reprezentowane zarówno w zestawie treningowym, jak i testowym.

Znajomość języka konwersacyjnego obsługuje dwie metody dzielenia danych:

  • Automatyczne dzielenie zestawu testów z danych treningowych: system podzieli dane oznakowane między zestawy treningowe i testowe, zgodnie z wybranymi wartościami procentowymi. Zalecany podział procentowy wynosi 80% na potrzeby trenowania i 20% do testowania.

Uwaga

Jeśli wybierzesz opcję Automatycznie rozdzielając zestaw testów z danych treningowych , tylko dane przypisane do zestawu treningowego zostaną podzielone zgodnie z podanymi wartościami procentowymi.

  • Użyj ręcznego podziału danych treningowych i testowych: ta metoda umożliwia użytkownikom definiowanie, które wypowiedzi powinny należeć do tego zestawu. Ten krok jest włączony tylko w przypadku dodania wypowiedzi do zestawu testów podczas etykietowania.

Tryby trenowania

Funkcja CLU obsługuje dwa tryby trenowania modeli

  • Trenowanie w warstwie Standardowa używa szybkich algorytmów uczenia maszynowego do trenowania modeli stosunkowo szybko. Jest to obecnie dostępne tylko dla języka angielskiego i jest wyłączone dla każdego projektu, który nie używa języka angielskiego (USA) lub angielskiego (Wielka Brytania) jako języka podstawowego. Ta opcja szkoleniowa jest bezpłatna. Trenowanie w warstwie Standardowa umożliwia dodawanie wypowiedzi i testowanie ich szybko bez kosztów. Pokazane wyniki oceny powinny prowadzić Cię do wprowadzania zmian w projekcie i dodawania kolejnych wypowiedzi. Po kilku iteracji i wprowadzeniu ulepszeń przyrostowych można rozważyć użycie zaawansowanego trenowania w celu wytrenowania innej wersji modelu.

  • Zaawansowane szkolenie używa najnowszych technologii uczenia maszynowego do dostosowywania modeli przy użyciu danych. Oczekuje się, że pokaże to lepsze wyniki wydajności dla modeli i umożliwi korzystanie z wielojęzycznych możliwości clu. Zaawansowane szkolenie jest wyceniane inaczej. Aby uzyskać szczegółowe informacje, zobacz informacje o cenach .

Użyj wyników oceny, aby kierować się decyzjami. Czasami może wystąpić sytuacja, w której określony przykład jest przewidywany niepoprawnie w zaawansowanym trenowaniu, a nie w przypadku korzystania ze standardowego trybu trenowania. Jeśli jednak ogólne wyniki oceny są lepsze przy użyciu zaawansowanych, zaleca się użycie końcowego modelu. Jeśli tak nie jest i nie chcesz używać żadnych funkcji wielojęzycznych, możesz nadal korzystać z modelu wyszkolonego w trybie standardowym.

Uwaga

Należy spodziewać się różnicy w zachowaniach w wynikach ufności intencji między trybami trenowania, ponieważ każdy algorytm skalibruje wyniki inaczej.

Trenowanie modelu

Aby rozpocząć trenowanie modelu z poziomu programu Language Studio:

  1. Wybierz pozycję Train model (Trenowanie modelu ) z menu po lewej stronie.

  2. Wybierz pozycję Start a training job (Uruchom zadanie szkoleniowe ) z górnego menu.

  3. Wybierz pozycję Train a new model (Trenowanie nowego modelu) i wpisz nazwę modelu w polu tekstowym. Możesz również zastąpić istniejący model , wybierając tę opcję i wybierając model, który chcesz zastąpić z menu rozwijanego. Zastępowanie wytrenowanego modelu jest nieodwracalne, ale nie wpłynie to na wdrożone modele do momentu wdrożenia nowego modelu.

  4. Wybierz tryb trenowania. Możesz wybrać standardowe szkolenie w celu szybszego trenowania, ale jest dostępne tylko dla języka angielskiego. Możesz też wybrać opcję Zaawansowane szkolenie , które jest obsługiwane w przypadku innych języków i projektów wielojęzycznych, ale obejmuje dłuższy czas trenowania. Dowiedz się więcej o trybach trenowania.

  5. Wybierz metodę dzielenia danych . Możesz wybrać opcję Automatyczne dzielenie zestawu testów na podstawie danych treningowych , w których system podzieli wypowiedzi między zestawy treningowe i testowe, zgodnie z określonymi wartościami procentowymi. Możesz też użyć ręcznego podziału danych treningowych i testowych, ta opcja jest włączona tylko w przypadku dodania wypowiedzi do zestawu testów podczas etykietowania wypowiedzi.

  6. Kliknij przycisk Train (Trenowanie ).

    Zrzut ekranu przedstawiający stronę trenowania w programie Language Studio.

  7. Kliknij identyfikator zadania szkoleniowego z listy. Zostanie wyświetlony panel, w którym można sprawdzić postęp trenowania, stan zadania i inne szczegóły dotyczące tego zadania.

    Uwaga

    • Tylko pomyślnie ukończone zadania szkoleniowe będą generować modele.
    • Trenowanie może zająć trochę czasu od kilku minut do kilku godzin na podstawie liczby wypowiedzi.
    • Jednocześnie może być uruchomione tylko jedno zadanie trenowania. Nie można uruchomić innego zadania trenowania w tym samym projekcie, dopóki uruchomione zadanie nie zostanie ukończone.
    • Uczenie maszynowe używane do trenowania modeli jest regularnie aktualizowane. Jeśli chcesz wytrenować poprzednią konfigurację, wybierz pozycję Kliknij tutaj, aby zmienić i wybrać poprzednią wersję konfiguracji trenowania.

Anulowanie zadania trenowania

Aby anulować zadanie szkoleniowe z poziomu programu Language Studio

  1. Na stronie Trenowanie modelu wybierz zadanie trenowania, które chcesz anulować, a następnie kliknij pozycję Anuluj w górnym menu.

Następne kroki