Udostępnij za pośrednictwem


Obsługa języka i regionu dla usługi LUIS

Ważne

Usługa LUIS zostanie wycofana 1 października 2025 r. i od 1 kwietnia 2023 r. nie będzie można utworzyć nowych zasobów usługi LUIS. Zalecamy migrację aplikacji LUIS do interpretacji języka konwersacyjnego, aby korzystać z ciągłej pomocy technicznej i wielojęzycznych możliwości produktów.

Usługa LUIS oferuje wiele funkcji. Nie wszystkie funkcje są równoważne w każdym języku. Upewnij się, że interesujące Cię funkcje są obsługiwane w Twojej docelowej kulturze językowej. Aplikacja usługi LUIS jest specyficzna dla kultury i nie można jej zmienić po jej ustawieniu.

Wielojęzyczne aplikacje usługi LUIS

Jeśli potrzebujesz wielojęzycznej aplikacji klienckiej usługi LUIS, takiej jak czatbot, masz kilka opcji. Jeśli usługa LUIS obsługuje wszystkie języki, tworzysz aplikację usługi LUIS dla każdego języka. Każda aplikacja usługi LUIS ma unikatowy identyfikator aplikacji i dziennik punktu końcowego. Jeśli musisz zapewnić obsługę języka dla języka, który usługa LUIS nie obsługuje, możesz użyć usługi Translator, aby przetłumaczyć wypowiedź na obsługiwany język, przesłać wypowiedź do punktu końcowego usługi LUIS i otrzymać wynikowe wyniki.

Uwaga

Nowsza wersja funkcji usługi Language Understanding jest teraz dostępna w ramach języka sztucznej inteligencji platformy Azure. Aby uzyskać więcej informacji, zobacz Dokumentację języka sztucznej inteligencji platformy Azure. Aby uzyskać informacje o możliwościach interpretacji języka, które obsługują wiele języków w usłudze językowej, zobacz Conversational Language Understanding.

Obsługiwane języki

Usługa LUIS rozumie wypowiedzi w następujących językach:

Język Ustawienia regionalne Wstępnie utworzona domena Wstępnie utworzona jednostka Rekomendacje dotyczące listy fraz **Analiza tonacji i wyodrębnianie kluczowych fraz
Arabski (wersja zapoznawcza — nowoczesny standardowy arabski) ar-AR - - - -
*Chiński zh-CN -
Niderlandzki nl-NL - -
Angielski (Stany Zjednoczone) en-US
Angielski (Wielka Brytania) en-GB
francuski (Kanada) fr-CA - - -
Francuski (Francja) fr-FR
Niemiecki de-DE
Gujarati (wersja zapoznawcza) gu-IN - - - -
Hindi (wersja zapoznawcza) hi-IN - - -
Włoski it-IT
*Japoński ja-JP Tylko fraza kluczowa
Koreański ko-KR - - Tylko fraza kluczowa
Marathi (wersja zapoznawcza) mr-IN - - - -
Portugalski (Brazylia) pt-BR nie wszystkie kultury podrzędne
Hiszpański (Meksyk) es-MX -
Hiszpański (Hiszpania) es-ES
Tamil (wersja zapoznawcza) ta-IN - - - -
Telugu (wersja zapoznawcza) te-IN - - - -
Turecki tr-TR - Tylko tonacja

Obsługa języka różni się w zależności od wstępnie utworzonych jednostek i wstępnie utworzonych domen.

*Chińskie informacje o pomocy technicznej

  • zh-CN W kulturze usługa LUIS oczekuje uproszczonego chińskiego zestawu znaków zamiast tradycyjnego zestawu znaków.
  • Nazwy intencji, jednostek, funkcji i wyrażeń regularnych mogą być znakami chińskimi lub rzymskimi.
  • Zapoznaj się ze wstępnie utworzonymi domenami, aby uzyskać informacje o tym, które wstępnie utworzone domeny są obsługiwane w zh-CN kulturze.

*Informacje o pomocy technicznej w języku japońskim

  • Ponieważ usługa LUIS nie zapewnia analizy składniowej i nie rozumie różnicy między Keigo i nieformalnym językiem japońskim, należy uwzględnić różne poziomy formalności jako przykłady szkoleń dla aplikacji.
    • でございます nie jest taki sam jak です.
    • です nie jest taki sam jak だ.

**Uwagi dotyczące obsługi usługi językowej

Usługa language obejmuje wstępnie skompilowaną jednostkę i analizę tonacji keyPhrase. Tylko język portugalski jest obsługiwany w przypadku podkultur: pt-PT i pt-BR. Wszystkie inne kultury są obsługiwane na poziomie kultury podstawowej.

Obsługiwane języki interfejsu API rozpoznawania mowy

Zobacz Języki obsługiwane przez mowę dla języków trybu dyktowania mowy.

Obsługiwane języki sprawdzania pisowni Bing

Zobacz Obsługiwane języki sprawdzania pisowni Bing, aby uzyskać listę obsługiwanych języków i stanu.

Rzadkie lub obce wyrazy w aplikacji

en-us W kulturze usługa LUIS uczy się rozróżniać większość angielskich słów, w tym slang. zh-cn W kulturze usługa LUIS uczy się rozróżniać większość chińskich znaków. Jeśli używasz rzadkiego wyrazu lub znaku w zh-cnen-us elemencie i widzisz, że usługa LUIS nie może odróżnić tego słowa lub znaku, możesz dodać ten wyraz lub znak do funkcji listy fraz. Na przykład wyrazy poza kulturą aplikacji — czyli wyrazy obce — powinny zostać dodane do funkcji listy fraz.

Języki hybrydowe

Języki hybrydowe łączą wyrazy z dwóch kultur, takich jak angielski i chiński. Te języki nie są obsługiwane w usłudze LUIS, ponieważ aplikacja jest oparta na jednej kulturze.

Tokenizacja

Aby przeprowadzić uczenie maszynowe, usługa LUIS dzieli wypowiedź na tokeny na podstawie kultury.

Język odstęp lub znak specjalny poziom znaku wyrazy złożone
Arabski
Chiński
Niderlandzki
Angielski (en-us)
Angielski (en-GB)
Francuski (fr-FR)
Francuski (fr-CA)
Niemiecki
Gudżarati
Hindi
Włoski
japoński
Koreański
Marathi
Portugalski (Brazylia)
Hiszpański (es-ES)
Hiszpański (es-MX)
Tamilski
Telugu
Turecki

Niestandardowe wersje tokenizatora

Następujące kultury mają niestandardowe wersje tokenizatora:

Kultura Wersja Purpose
Niemiecki
de-de
1.0.0 Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki.
Jeśli użytkownik wprowadzi Ich fahre einen krankenwagen jako wypowiedź, zostanie on odwrócony do Ich fahre einen kranken wagen. Zezwalanie na oznaczenie kranken i wagen niezależnie jako różne jednostki.
Niemiecki
de-de
1.0.2 Tokenizuje wyrazy, dzieląc je na spacje.
Jeśli użytkownik wprowadzi Ich fahre einen krankenwagen jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób krankenwagen jest oznaczony jako pojedyncza jednostka.
Niderlandzki
nl-nl
1.0.0 Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki.
Jeśli użytkownik wprowadzi Ik ga naar de kleuterschool jako wypowiedź, zostanie on odwrócony do Ik ga naar de kleuter school. Zezwalanie na oznaczenie kleuter i school niezależnie jako różne jednostki.
Niderlandzki
nl-nl
1.0.1 Tokenizuje wyrazy, dzieląc je na spacje.
Jeśli użytkownik wprowadzi Ik ga naar de kleuterschool jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób kleuterschool jest oznaczony jako pojedyncza jednostka.

Migrowanie między wersjami tokenizatora

Tokenizacja odbywa się na poziomie aplikacji. Nie ma obsługi tokenizacji na poziomie wersji.

Zaimportuj plik jako nową aplikację zamiast wersji. Ta akcja oznacza, że nowa aplikacja ma inny identyfikator aplikacji, ale używa wersji tokenizatora określonej w pliku.