Wypowiedzi
Ważne
Usługa LUIS zostanie wycofana 1 października 2025 r. i od 1 kwietnia 2023 r. nie będzie można utworzyć nowych zasobów usługi LUIS. Zalecamy migrację aplikacji LUIS do interpretacji języka konwersacyjnego, aby korzystać z ciągłej pomocy technicznej i wielojęzycznych możliwości produktów.
Wypowiedzi to dane wejściowe od użytkowników, których aplikacja musi interpretować. Aby wytrenować usługę LUIS do wyodrębniania intencji i jednostek z tych danych wejściowych, ważne jest przechwycenie różnych przykładowych wypowiedzi dla każdej intencji. Uczenie aktywne lub proces ciągłego trenowania nowych wypowiedzi jest niezbędny dla analizy uczenia maszynowego zapewnianej przez usługę LUIS.
Zbierz wypowiedzi, które uważasz, że użytkownicy wejdą. Uwzględnij wypowiedzi, które oznaczają to samo, ale są konstruowane na różne sposoby:
- Długość wypowiedzi — krótka, średnia i długa dla aplikacji klienckiej
- Długość wyrazów i fraz
- Umieszczanie wyrazów — jednostka na początku, środku i na końcu wypowiedzi
- Gramatyka
- Pluralizacja
- Wynikające
- Wybór czasownika i czasownika
- Interpunkcja — używanie zarówno poprawnej, jak i niepoprawnej gramatyki
Wybieranie różnych wypowiedzi
Po rozpoczęciu dodawania przykładowych wypowiedzi do modelu usługi LUIS należy pamiętać o kilku zasadach:
Wypowiedzi nie zawsze są dobrze sformułowane
Twoja aplikacja może wymagać przetwarzania zdań, takich jak "Zarezerwuj bilet do Paryża dla mnie" lub fragment zdania, takiego jak "Booking" lub "Lot w Paryżu" Użytkownicy często popełniają błędy pisowni. Podczas planowania aplikacji należy rozważyć, czy chcesz użyć sprawdzania pisowni Bing, aby poprawić dane wejściowe użytkownika przed przekazaniem jej do usługi LUIS.
Jeśli nie sprawdzasz pisowni wypowiedzi użytkowników, należy wytrenować usługę LUIS w wypowiedziach zawierających literówki i błędy pisowni.
Używanie reprezentatywnego języka użytkownika
Podczas wybierania wypowiedzi należy pamiętać, że typowe terminy lub frazy mogą nie być typowe dla typowego użytkownika aplikacji klienckiej. Mogą nie mieć doświadczenia w domenie lub użyć innej terminologii. Należy zachować ostrożność podczas używania terminów lub fraz, które użytkownik powiedziałby tylko wtedy, gdy był ekspertem.
Wybieranie zróżnicowanej terminologii i fraz
Przekonasz się, że nawet jeśli tworzysz różne wzorce zdań, nadal powtarzasz pewne słownictwo. Na przykład następujące wypowiedzi mają podobne znaczenie, ale różne terminologia i frazy:
- "Jak mogę uzyskać komputer?".
- "Gdzie mogę uzyskać komputer?".
- "Chcę uzyskać komputer, jak mogę o tym chodzić?".
- "Kiedy mogę mieć komputer?".
Podstawowy termin tutaj, komputer, nie jest zróżnicowany. Użyj alternatyw, takich jak komputer stacjonarny, laptop, stacja robocza, a nawet tylko maszyna. Usługa LUIS może inteligentnie wnioskować synonimy z kontekstu, ale podczas tworzenia wypowiedzi na potrzeby trenowania zawsze lepiej je zmieniać.
Przykładowe wypowiedzi w każdej intencji
Każda intencja musi mieć przykładowe wypowiedzi — co najmniej 15. Jeśli masz intencję, która nie ma żadnych przykładowych wypowiedzi, nie będzie można wytrenować usługi LUIS. Jeśli masz intencję z co najmniej jedną przykładową wypowiedzią, usługa LUIS może nie dokładnie przewidzieć intencji.
Dodawanie małych grup wypowiedzi
Za każdym razem, gdy wykonujesz iterację modelu, aby go ulepszyć, nie dodawaj dużych ilości wypowiedzi. Rozważ dodanie wypowiedzi w ilościach 15. Następnie wytrenuj, opublikuj i przetestuj ponownie.
Usługa LUIS tworzy efektywne modele z wypowiedziami starannie wybranymi przez autora modelu usługi LUIS. Dodawanie zbyt wielu wypowiedzi nie jest cenne, ponieważ wprowadza zamieszanie.
Lepiej zacząć od kilku wypowiedzi, a następnie przejrzeć wypowiedzi punktu końcowego pod kątem poprawnego przewidywania intencji i wyodrębniania jednostek.
Normalizacja wypowiedzi
Normalizacja wypowiedzi to proces ignorowania efektów tekstu, takich jak interpunkcja i znaki diakrytyczne, podczas trenowania i przewidywania.
Ustawienia normalizacji wypowiedzi są domyślnie wyłączone. Do tych ustawień należą:
- Formularze programu Word
- Znaków diakrytycznych
- Znaki interpunkcyjne
Jeśli włączysz ustawienie normalizacji, wyniki w okienku Test, testy wsadowe i zapytania punktu końcowego zmienią się dla wszystkich wypowiedzi dla tego ustawienia normalizacji.
Podczas klonowania wersji w portalu usługi LUIS ustawienia wersji są przechowywane w nowej sklonowanej wersji.
Ustaw ustawienia wersji aplikacji przy użyciu portalu usługi LUIS, wybierając pozycję Zarządzaj w górnym menu nawigacji na stronie Ustawienia aplikacji. Możesz również użyć interfejsu API ustawień wersji aktualizacji. Aby uzyskać więcej informacji, zobacz dokumentację referencyjną.
Formularze programu Word
Normalizacja formularzy wyrazów ignoruje różnice w słowach, które rozszerzają się poza katalog główny.
Znaków diakrytycznych
Znaki diakrytyczne są znakami lub znakami w tekście, takimi jak:
İ ı Ş Ğ ş ğ ö ü
Znaki interpunkcyjne
Normalizacja interpunkcji oznacza, że przed wytrenowaniem modeli i przed przewidywaniem zapytań punktu końcowego interpunkcja zostanie usunięta z wypowiedzi.
Interpunkcja to oddzielny token w usłudze LUIS. Wypowiedź zawierająca kropkę na końcu jest oddzielną wypowiedzią, która nie zawiera kropki na końcu i może uzyskać dwie różne przewidywania.
Jeśli interpunkcja nie jest znormalizowana, usługa LUIS domyślnie nie ignoruje znaków interpunkcyjnych, ponieważ niektóre aplikacje klienckie mogą umieszczać znaczenie na tych znakach. Pamiętaj, aby uwzględnić przykładowe wypowiedzi korzystające z interpunkcji i te, które nie są używane, aby oba style zwracały te same względne wyniki.
Upewnij się, że model obsługuje znaki interpunkcyjne w przykładowych wypowiedziach (zarówno mających, jak i nie mających interpunkcji) lub we wzorcach, w których łatwiej jest zignorować interpunkcję. Na przykład: Ubiegam się o stanowisko {Job} [.]
Jeśli interpunkcja nie ma określonego znaczenia w aplikacji klienckiej, rozważ zignorowanie interpunkcji przez normalizację interpunkcji.
Ignorowanie wyrazów i znaków interpunkcyjnych
Jeśli chcesz zignorować określone wyrazy lub znaki interpunkcyjne we wzorcach, użyj wzorca z ignorowaną składnią nawiasów kwadratowych, []
.
Trenowanie ze wszystkimi wypowiedziami
Trenowanie jest nieokreślone: przewidywanie wypowiedzi może się nieznacznie różnić w zależności od wersji lub aplikacji. Trenowanie nieokreślone można usunąć, aktualizując interfejs API ustawień wersji przy użyciu pary UseAllTrainingData name/value, aby używać wszystkich danych szkoleniowych.
Testowanie wypowiedzi
Deweloperzy powinni rozpocząć testowanie aplikacji LUIS przy użyciu rzeczywistych danych, wysyłając wypowiedzi do adresu URL punktu końcowego przewidywania. Te wypowiedzi są używane do poprawy wydajności intencji i jednostek za pomocą funkcji Przeglądanie wypowiedzi. Testy przesłane przy użyciu okienka testowania w portalu usługi LUIS nie są wysyłane za pośrednictwem punktu końcowego i nie przyczyniają się do aktywnego uczenia się.
Przeglądanie wypowiedzi
Po wytrenowanym, opublikowanym i odbieraniu zapytań dotyczących punktu końcowego przejrzyj wypowiedzi sugerowane przez usługę LUIS. Usługa LUIS wybiera wypowiedzi punktu końcowego, które mają niskie wyniki dla intencji lub jednostki.
Najlepsze rozwiązania
Etykieta dla znaczenia wyrazu
Jeśli wybór słowa lub układ wyrazów jest taki sam, ale nie oznacza tego samego, nie oznaczaj go jednostką.
W następujących wypowiedziach słowo fair jest hoograf, co oznacza, że jest to napisane tak samo, ale ma inne znaczenie:
- "Jakie rodzaje targów powiatowych odbywają się w rejonie Seattle tego lata?"
- "Czy aktualna ocena na 2 gwiazdki na targach restauracji?
Jeśli chcesz, aby jednostka zdarzenia znalazła wszystkie dane zdarzenia, oznacz wyraz fair w pierwszej wypowiedzi, ale nie w drugiej.
Nie ignoruj możliwych odmian wypowiedzi
Usługa LUIS oczekuje zmian w wypowiedziach intencji. Wypowiedzi mogą się różnić, jednocześnie mając takie samo ogólne znaczenie. Odmiany mogą obejmować długość wypowiedzi, wybór wyrazu i umieszczanie wyrazów.
Nie używaj tego samego formatu | Używaj różnych formatów |
---|---|
Kup bilet do Seattle | Kup bilet 1 do Seattle |
Kup bilet do Paryża | Zarezerwuj dwa bilety na czerwone oko do Paryża w najbliższy poniedziałek |
Kup bilet do Orlando | Chciałbym zarezerwować 3 bilety do Orlando na przerwę wiosenną |
Druga kolumna używa różnych czasowników (buy, reserve, book), różnych ilości (1, &"two", 3) i różnych uzgodnień słów, ale wszystkie mają taki sam zamiar zakupu biletów lotniczych na podróż.
Nie dodawaj zbyt wielu przykładowych wypowiedzi do intencji
Po opublikowaniu aplikacji dodaj tylko wypowiedzi z aktywnego uczenia się w procesie cyklu projektowania. Jeśli wypowiedzi są zbyt podobne, dodaj wzorzec.