Obsługa języka i regionu dla usługi LUIS

Ważne

Usługa LUIS zostanie wycofana 1 października 2025 r. i od 1 kwietnia 2023 r. nie będzie można tworzyć nowych zasobów usługi LUIS. Zalecamy migrowanie aplikacji LUIS do interpretacji języka konwersacyjnego , aby korzystać z ciągłej pomocy technicznej produktu i możliwości wielojęzycznych.

Usługa LUIS oferuje wiele funkcji. Nie wszystkie funkcje są równoważne w każdym języku. Upewnij się, że interesujące Cię funkcje są obsługiwane w Twojej docelowej kulturze językowej. Aplikacja usługi LUIS jest specyficzna dla kultury i nie można jej zmienić po jej ustawieniu.

Wielojęzyczne aplikacje usługi LUIS

Jeśli potrzebujesz wielojęzycznej aplikacji klienckiej usługi LUIS, takiej jak czatbot, masz kilka opcji. Jeśli usługa LUIS obsługuje wszystkie języki, tworzysz aplikację usługi LUIS dla każdego języka. Każda aplikacja usługi LUIS ma unikatowy identyfikator aplikacji i dziennik punktu końcowego. Jeśli musisz zapewnić interpretację języka dla języka, który usługa LUIS nie obsługuje, możesz użyć usługi Translator , aby przetłumaczyć wypowiedź na obsługiwany język, przesłać wypowiedź do punktu końcowego usługi LUIS i otrzymać wynikowe wyniki.

Uwaga

Nowsza wersja funkcji Language Understanding jest teraz dostępna w ramach języka sztucznej inteligencji platformy Azure. Aby uzyskać więcej informacji, zobacz Dokumentację języka sztucznej inteligencji platformy Azure. Aby uzyskać informacje na temat możliwości interpretacji języka, które obsługują wiele języków w usłudze językowej, zobacz Konwersacyjne Language Understanding.

Obsługiwane języki

Usługa LUIS rozumie wypowiedzi w następujących językach:

Język Regionalne Wstępnie utworzona domena Wstępnie utworzona jednostka Zalecenia dotyczące listy fraz **Analiza tonacji i wyodrębnianie kluczowych fraz
Arabski (wersja zapoznawcza — nowoczesny standardowy arabski) ar-AR - - - -
*Chiński zh-CN -
Niderlandzki nl-NL - -
Angielski (Stany Zjednoczone) en-US
Angielski (Wielka Brytania) en-GB
francuski (Kanada) fr-CA - - -
Francuski (Francja) fr-FR
Niemiecki de-DE
Gujarati (wersja zapoznawcza) gu-IN - - - -
Hindi (wersja zapoznawcza) hi-IN - - -
Włoski it-IT
*Japoński ja-JP Tylko fraza kluczowa
Koreański ko-KR - - Tylko fraza kluczowa
Marathi (wersja zapoznawcza) mr-IN - - - -
Portugalski (Brazylia) pt-BR nie wszystkie podkulturowe
Hiszpański (Meksyk) es-MX -
hiszpański (Hiszpania) es-ES
Tamil (wersja zapoznawcza) ta-IN - - - -
Telugu (wersja zapoznawcza) te-IN - - - -
Turecki tr-TR - Tylko tonacja

Obsługa języka różni się w zależności od wstępnie utworzonych jednostek i wstępnie utworzonych domen.

*Chińskie uwagi dotyczące pomocy technicznej

  • zh-CN W kulturze usługa LUIS oczekuje uproszczonego chińskiego zestawu znaków zamiast tradycyjnego zestawu znaków.
  • Nazwy intencji, jednostek, funkcji i wyrażeń regularnych mogą być znakiem chińskim lub rzymskim.
  • Zapoznaj się ze wstępnie utworzonymi domenami, aby uzyskać informacje o tym, które wstępnie utworzone domeny są obsługiwane w zh-CN kulturze.

*Informacje o pomocy technicznej w języku japońskim

  • Ponieważ usługa LUIS nie zapewnia analizy składniowej i nie rozumie różnicy między Keigo i nieformalnym Japońskim, należy uwzględnić różne poziomy formalności jako przykłady szkoleń dla aplikacji.
    • でございます nie jest taki sam jak です.
    • です nie jest taki sam jak だ.

**Informacje o obsłudze usługi językowej

Usługa language obejmuje wstępnie utworzoną jednostkę keyPhrase i analizę tonacji. Tylko portugalski jest obsługiwany w przypadku podkultur: pt-PT i pt-BR. Wszystkie inne kultury są obsługiwane na poziomie kultury podstawowej.

Obsługiwane języki interfejsu API rozpoznawania mowy

Zobacz Języki obsługiwane przez mowę dla języków trybu dyktowania mowy.

Obsługiwane języki sprawdzania pisowni Bing

Zobacz Obsługiwane języki sprawdzania pisowni Bing, aby uzyskać listę obsługiwanych języków i stanu.

Rzadkie lub obce wyrazy w aplikacji

en-us W kulturze usługa LUIS uczy się rozróżniać większość angielskich słów, w tym slang. zh-cn W kulturze usługa LUIS uczy się rozróżniać większość chińskich znaków. Jeśli używasz rzadkiego słowa lub znaku w en-uszh-cnsystemie i widzisz, że usługa LUIS nie może odróżnić tego słowa lub znaku, możesz dodać to słowo lub znak do funkcji listy fraz. Na przykład wyrazy spoza kultury aplikacji — czyli wyrazy obce — powinny zostać dodane do funkcji listy fraz.

Języki hybrydowe

Języki hybrydowe łączą wyrazy z dwóch kultur, takich jak angielski i chiński. Te języki nie są obsługiwane w usłudze LUIS, ponieważ aplikacja jest oparta na jednej kulturze.

Tokenizacja

Aby przeprowadzić uczenie maszynowe, usługa LUIS dzieli wypowiedź na tokeny oparte na kulturze.

Język każdą spację lub znak specjalny poziom znaków wyrazy złożone
Arabski
Chiński
Niderlandzki
Angielski (en-us)
Angielski (en-GB)
Francuski (fr-FR)
Francuski (fr-CA)
Niemiecki
Gudżarati
Hindi
Włoski
japoński
Koreański
Marathi
Portugalski (Brazylia)
Hiszpański (es-ES)
Hiszpański (es-MX)
Tamilski
Telugu
Turecki

Niestandardowe wersje tokenizatora

Następujące kultury mają niestandardowe wersje tokenizatora:

Kultura Wersja Przeznaczenie
Niemiecki
de-de
1.0.0 Tokenizuje słowa, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki.
Jeśli użytkownik wprowadza Ich fahre einen krankenwagen jako wypowiedź, zostanie on włączony do Ich fahre einen kranken wagen. Zezwalanie na oznaczanie kranken i wagen niezależnie jako różne jednostki.
Niemiecki
de-de
1.0.2 Tokenizuje wyrazy, dzieląc je na spacje.
Jeśli użytkownik wprowadza Ich fahre einen krankenwagen jako wypowiedź, pozostanie jednym tokenem. W ten sposób krankenwagen jest oznaczony jako pojedyncza jednostka.
Niderlandzki
nl-nl
1.0.0 Tokenizuje słowa, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki.
Jeśli użytkownik wprowadza Ik ga naar de kleuterschool jako wypowiedź, zostanie on włączony do Ik ga naar de kleuter school. Zezwalanie na oznaczanie kleuter i school niezależnie jako różne jednostki.
Niderlandzki
nl-nl
1.0.1 Tokenizuje wyrazy, dzieląc je na spacje.
Jeśli użytkownik wprowadza Ik ga naar de kleuterschool jako wypowiedź, pozostanie jednym tokenem. W ten sposób kleuterschool jest oznaczony jako pojedyncza jednostka.

Migrowanie między wersjami tokenizatora

Tokenizacja odbywa się na poziomie aplikacji. Nie ma obsługi tokenizacji na poziomie wersji.

Zaimportuj plik jako nową aplikację zamiast wersji. Ta akcja oznacza, że nowa aplikacja ma inny identyfikator aplikacji, ale używa wersji tokenizatora określonej w pliku.