Obsługa języka i regionu dla usługi LUIS

Artykuł
09/01/2024

Ważne

Usługa LUIS zostanie wycofana 1 października 2025 r. i od 1 kwietnia 2023 r. nie będzie można utworzyć nowych zasobów usługi LUIS. Zalecamy migrację aplikacji LUIS do interpretacji języka konwersacyjnego, aby korzystać z ciągłej pomocy technicznej i wielojęzycznych możliwości produktów.

Usługa LUIS oferuje wiele funkcji. Nie wszystkie funkcje są równoważne w każdym języku. Upewnij się, że interesujące Cię funkcje są obsługiwane w Twojej docelowej kulturze językowej. Aplikacja usługi LUIS jest specyficzna dla kultury i nie można jej zmienić po jej ustawieniu.

Wielojęzyczne aplikacje usługi LUIS

Jeśli potrzebujesz wielojęzycznej aplikacji klienckiej usługi LUIS, takiej jak czatbot, masz kilka opcji. Jeśli usługa LUIS obsługuje wszystkie języki, tworzysz aplikację usługi LUIS dla każdego języka. Każda aplikacja usługi LUIS ma unikatowy identyfikator aplikacji i dziennik punktu końcowego. Jeśli musisz zapewnić obsługę języka dla języka, który usługa LUIS nie obsługuje, możesz użyć usługi Translator, aby przetłumaczyć wypowiedź na obsługiwany język, przesłać wypowiedź do punktu końcowego usługi LUIS i otrzymać wynikowe wyniki.

Uwaga

Nowsza wersja funkcji usługi Language Understanding jest teraz dostępna w ramach języka sztucznej inteligencji platformy Azure. Aby uzyskać więcej informacji, zobacz Dokumentację języka sztucznej inteligencji platformy Azure. Aby uzyskać informacje o możliwościach interpretacji języka, które obsługują wiele języków w usłudze językowej, zobacz Conversational Language Understanding.

Obsługiwane języki

Usługa LUIS rozumie wypowiedzi w następujących językach:

Język	Ustawienia regionalne	Wstępnie utworzona domena	Wstępnie utworzona jednostka	Rekomendacje dotyczące listy fraz	**Analiza tonacji i wyodrębnianie kluczowych fraz
Arabski (wersja zapoznawcza — nowoczesny standardowy arabski)	`ar-AR`	-	-	-	-
*Chiński	`zh-CN`	✔	✔	✔	-
Niderlandzki	`nl-NL`	✔	-	-	✔
Angielski (Stany Zjednoczone)	`en-US`	✔	✔	✔	✔
Angielski (Wielka Brytania)	`en-GB`	✔	✔	✔	✔
francuski (Kanada)	`fr-CA`	-	-	-	✔
Francuski (Francja)	`fr-FR`	✔	✔	✔	✔
Niemiecki	`de-DE`	✔	✔	✔	✔
Gujarati (wersja zapoznawcza)	`gu-IN`	-	-	-	-
Hindi (wersja zapoznawcza)	`hi-IN`	-	✔	-	-
Włoski	`it-IT`	✔	✔	✔	✔
*Japoński	`ja-JP`	✔	✔	✔	Tylko fraza kluczowa
Koreański	`ko-KR`	✔	-	-	Tylko fraza kluczowa
Marathi (wersja zapoznawcza)	`mr-IN`	-	-	-	-
Portugalski (Brazylia)	`pt-BR`	✔	✔	✔	nie wszystkie kultury podrzędne
Hiszpański (Meksyk)	`es-MX`	-	✔	✔	✔
Hiszpański (Hiszpania)	`es-ES`	✔	✔	✔	✔
Tamil (wersja zapoznawcza)	`ta-IN`	-	-	-	-
Telugu (wersja zapoznawcza)	`te-IN`	-	-	-	-
Turecki	`tr-TR`	✔	✔	-	Tylko tonacja

Obsługa języka różni się w zależności od wstępnie utworzonych jednostek i wstępnie utworzonych domen.

*Chińskie informacje o pomocy technicznej

zh-CN W kulturze usługa LUIS oczekuje uproszczonego chińskiego zestawu znaków zamiast tradycyjnego zestawu znaków.
Nazwy intencji, jednostek, funkcji i wyrażeń regularnych mogą być znakami chińskimi lub rzymskimi.
Zapoznaj się ze wstępnie utworzonymi domenami, aby uzyskać informacje o tym, które wstępnie utworzone domeny są obsługiwane w zh-CN kulturze.

*Informacje o pomocy technicznej w języku japońskim

Ponieważ usługa LUIS nie zapewnia analizy składniowej i nie rozumie różnicy między Keigo i nieformalnym językiem japońskim, należy uwzględnić różne poziomy formalności jako przykłady szkoleń dla aplikacji.
- でございます nie jest taki sam jak です.
- です nie jest taki sam jak だ.

**Uwagi dotyczące obsługi usługi językowej

Usługa language obejmuje wstępnie skompilowaną jednostkę i analizę tonacji keyPhrase. Tylko język portugalski jest obsługiwany w przypadku podkultur: pt-PT i pt-BR. Wszystkie inne kultury są obsługiwane na poziomie kultury podstawowej.

Obsługiwane języki interfejsu API rozpoznawania mowy

Zobacz Języki obsługiwane przez mowę dla języków trybu dyktowania mowy.

Obsługiwane języki sprawdzania pisowni Bing

Zobacz Obsługiwane języki sprawdzania pisowni Bing, aby uzyskać listę obsługiwanych języków i stanu.

Rzadkie lub obce wyrazy w aplikacji

en-us W kulturze usługa LUIS uczy się rozróżniać większość angielskich słów, w tym slang. zh-cn W kulturze usługa LUIS uczy się rozróżniać większość chińskich znaków. Jeśli używasz rzadkiego wyrazu lub znaku w zh-cnen-us elemencie i widzisz, że usługa LUIS nie może odróżnić tego słowa lub znaku, możesz dodać ten wyraz lub znak do funkcji listy fraz. Na przykład wyrazy poza kulturą aplikacji — czyli wyrazy obce — powinny zostać dodane do funkcji listy fraz.

Języki hybrydowe

Języki hybrydowe łączą wyrazy z dwóch kultur, takich jak angielski i chiński. Te języki nie są obsługiwane w usłudze LUIS, ponieważ aplikacja jest oparta na jednej kulturze.

Tokenizacja

Aby przeprowadzić uczenie maszynowe, usługa LUIS dzieli wypowiedź na tokeny na podstawie kultury.

Język	odstęp lub znak specjalny	poziom znaku	wyrazy złożone
Arabski	✔
Chiński		✔
Niderlandzki	✔		✔
Angielski (en-us)	✔
Angielski (en-GB)	✔
Francuski (fr-FR)	✔
Francuski (fr-CA)	✔
Niemiecki	✔		✔
Gudżarati	✔
Hindi	✔
Włoski	✔
japoński			✔
Koreański		✔
Marathi	✔
Portugalski (Brazylia)	✔
Hiszpański (es-ES)	✔
Hiszpański (es-MX)	✔
Tamilski	✔
Telugu	✔
Turecki	✔

Niestandardowe wersje tokenizatora

Następujące kultury mają niestandardowe wersje tokenizatora:

Kultura	Wersja	Purpose
Niemiecki `de-de`	1.0.0	Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki. Jeśli użytkownik wprowadzi `Ich fahre einen krankenwagen` jako wypowiedź, zostanie on odwrócony do `Ich fahre einen kranken wagen`. Zezwalanie na oznaczenie `kranken` i `wagen` niezależnie jako różne jednostki.
Niemiecki `de-de`	1.0.2	Tokenizuje wyrazy, dzieląc je na spacje. Jeśli użytkownik wprowadzi `Ich fahre einen krankenwagen` jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób `krankenwagen` jest oznaczony jako pojedyncza jednostka.
Niderlandzki `nl-nl`	1.0.0	Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki. Jeśli użytkownik wprowadzi `Ik ga naar de kleuterschool` jako wypowiedź, zostanie on odwrócony do `Ik ga naar de kleuter school`. Zezwalanie na oznaczenie `kleuter` i `school` niezależnie jako różne jednostki.
Niderlandzki `nl-nl`	1.0.1	Tokenizuje wyrazy, dzieląc je na spacje. Jeśli użytkownik wprowadzi `Ik ga naar de kleuterschool` jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób `kleuterschool` jest oznaczony jako pojedyncza jednostka.

Migrowanie między wersjami tokenizatora

Tokenizacja odbywa się na poziomie aplikacji. Nie ma obsługi tokenizacji na poziomie wersji.

Zaimportuj plik jako nową aplikację zamiast wersji. Ta akcja oznacza, że nowa aplikacja ma inny identyfikator aplikacji, ale używa wersji tokenizatora określonej w pliku.

Udostępnij za pośrednictwem