Obsługa języka i regionu dla usługi LUIS
Ważne
Usługa LUIS zostanie wycofana 1 października 2025 r. i od 1 kwietnia 2023 r. nie będzie można utworzyć nowych zasobów usługi LUIS. Zalecamy migrację aplikacji LUIS do interpretacji języka konwersacyjnego, aby korzystać z ciągłej pomocy technicznej i wielojęzycznych możliwości produktów.
Usługa LUIS oferuje wiele funkcji. Nie wszystkie funkcje są równoważne w każdym języku. Upewnij się, że interesujące Cię funkcje są obsługiwane w Twojej docelowej kulturze językowej. Aplikacja usługi LUIS jest specyficzna dla kultury i nie można jej zmienić po jej ustawieniu.
Wielojęzyczne aplikacje usługi LUIS
Jeśli potrzebujesz wielojęzycznej aplikacji klienckiej usługi LUIS, takiej jak czatbot, masz kilka opcji. Jeśli usługa LUIS obsługuje wszystkie języki, tworzysz aplikację usługi LUIS dla każdego języka. Każda aplikacja usługi LUIS ma unikatowy identyfikator aplikacji i dziennik punktu końcowego. Jeśli musisz zapewnić obsługę języka dla języka, który usługa LUIS nie obsługuje, możesz użyć usługi Translator, aby przetłumaczyć wypowiedź na obsługiwany język, przesłać wypowiedź do punktu końcowego usługi LUIS i otrzymać wynikowe wyniki.
Uwaga
Nowsza wersja funkcji usługi Language Understanding jest teraz dostępna w ramach języka sztucznej inteligencji platformy Azure. Aby uzyskać więcej informacji, zobacz Dokumentację języka sztucznej inteligencji platformy Azure. Aby uzyskać informacje o możliwościach interpretacji języka, które obsługują wiele języków w usłudze językowej, zobacz Conversational Language Understanding.
Obsługiwane języki
Usługa LUIS rozumie wypowiedzi w następujących językach:
Język | Ustawienia regionalne | Wstępnie utworzona domena | Wstępnie utworzona jednostka | Rekomendacje dotyczące listy fraz | **Analiza tonacji i wyodrębnianie kluczowych fraz |
---|---|---|---|---|---|
Arabski (wersja zapoznawcza — nowoczesny standardowy arabski) | ar-AR |
- | - | - | - |
*Chiński | zh-CN |
✔ | ✔ | ✔ | - |
Niderlandzki | nl-NL |
✔ | - | - | ✔ |
Angielski (Stany Zjednoczone) | en-US |
✔ | ✔ | ✔ | ✔ |
Angielski (Wielka Brytania) | en-GB |
✔ | ✔ | ✔ | ✔ |
francuski (Kanada) | fr-CA |
- | - | - | ✔ |
Francuski (Francja) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Niemiecki | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (wersja zapoznawcza) | gu-IN |
- | - | - | - |
Hindi (wersja zapoznawcza) | hi-IN |
- | ✔ | - | - |
Włoski | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japoński | ja-JP |
✔ | ✔ | ✔ | Tylko fraza kluczowa |
Koreański | ko-KR |
✔ | - | - | Tylko fraza kluczowa |
Marathi (wersja zapoznawcza) | mr-IN |
- | - | - | - |
Portugalski (Brazylia) | pt-BR |
✔ | ✔ | ✔ | nie wszystkie kultury podrzędne |
Hiszpański (Meksyk) | es-MX |
- | ✔ | ✔ | ✔ |
Hiszpański (Hiszpania) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamil (wersja zapoznawcza) | ta-IN |
- | - | - | - |
Telugu (wersja zapoznawcza) | te-IN |
- | - | - | - |
Turecki | tr-TR |
✔ | ✔ | - | Tylko tonacja |
Obsługa języka różni się w zależności od wstępnie utworzonych jednostek i wstępnie utworzonych domen.
*Chińskie informacje o pomocy technicznej
zh-CN
W kulturze usługa LUIS oczekuje uproszczonego chińskiego zestawu znaków zamiast tradycyjnego zestawu znaków.- Nazwy intencji, jednostek, funkcji i wyrażeń regularnych mogą być znakami chińskimi lub rzymskimi.
- Zapoznaj się ze wstępnie utworzonymi domenami, aby uzyskać informacje o tym, które wstępnie utworzone domeny są obsługiwane w
zh-CN
kulturze.
*Informacje o pomocy technicznej w języku japońskim
- Ponieważ usługa LUIS nie zapewnia analizy składniowej i nie rozumie różnicy między Keigo i nieformalnym językiem japońskim, należy uwzględnić różne poziomy formalności jako przykłady szkoleń dla aplikacji.
- でございます nie jest taki sam jak です.
- です nie jest taki sam jak だ.
**Uwagi dotyczące obsługi usługi językowej
Usługa language obejmuje wstępnie skompilowaną jednostkę i analizę tonacji keyPhrase. Tylko język portugalski jest obsługiwany w przypadku podkultur: pt-PT
i pt-BR
. Wszystkie inne kultury są obsługiwane na poziomie kultury podstawowej.
Obsługiwane języki interfejsu API rozpoznawania mowy
Zobacz Języki obsługiwane przez mowę dla języków trybu dyktowania mowy.
Obsługiwane języki sprawdzania pisowni Bing
Zobacz Obsługiwane języki sprawdzania pisowni Bing, aby uzyskać listę obsługiwanych języków i stanu.
Rzadkie lub obce wyrazy w aplikacji
en-us
W kulturze usługa LUIS uczy się rozróżniać większość angielskich słów, w tym slang. zh-cn
W kulturze usługa LUIS uczy się rozróżniać większość chińskich znaków. Jeśli używasz rzadkiego wyrazu lub znaku w zh-cn
en-us
elemencie i widzisz, że usługa LUIS nie może odróżnić tego słowa lub znaku, możesz dodać ten wyraz lub znak do funkcji listy fraz. Na przykład wyrazy poza kulturą aplikacji — czyli wyrazy obce — powinny zostać dodane do funkcji listy fraz.
Języki hybrydowe
Języki hybrydowe łączą wyrazy z dwóch kultur, takich jak angielski i chiński. Te języki nie są obsługiwane w usłudze LUIS, ponieważ aplikacja jest oparta na jednej kulturze.
Tokenizacja
Aby przeprowadzić uczenie maszynowe, usługa LUIS dzieli wypowiedź na tokeny na podstawie kultury.
Język | odstęp lub znak specjalny | poziom znaku | wyrazy złożone |
---|---|---|---|
Arabski | ✔ | ||
Chiński | ✔ | ||
Niderlandzki | ✔ | ✔ | |
Angielski (en-us) | ✔ | ||
Angielski (en-GB) | ✔ | ||
Francuski (fr-FR) | ✔ | ||
Francuski (fr-CA) | ✔ | ||
Niemiecki | ✔ | ✔ | |
Gudżarati | ✔ | ||
Hindi | ✔ | ||
Włoski | ✔ | ||
japoński | ✔ | ||
Koreański | ✔ | ||
Marathi | ✔ | ||
Portugalski (Brazylia) | ✔ | ||
Hiszpański (es-ES) | ✔ | ||
Hiszpański (es-MX) | ✔ | ||
Tamilski | ✔ | ||
Telugu | ✔ | ||
Turecki | ✔ |
Niestandardowe wersje tokenizatora
Następujące kultury mają niestandardowe wersje tokenizatora:
Kultura | Wersja | Purpose |
---|---|---|
Niemieckide-de |
1.0.0 | Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki. Jeśli użytkownik wprowadzi Ich fahre einen krankenwagen jako wypowiedź, zostanie on odwrócony do Ich fahre einen kranken wagen . Zezwalanie na oznaczenie kranken i wagen niezależnie jako różne jednostki. |
Niemieckide-de |
1.0.2 | Tokenizuje wyrazy, dzieląc je na spacje. Jeśli użytkownik wprowadzi Ich fahre einen krankenwagen jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób krankenwagen jest oznaczony jako pojedyncza jednostka. |
Niderlandzkinl-nl |
1.0.0 | Tokenizuje wyrazy, dzieląc je przy użyciu tokenizatora opartego na uczeniu maszynowym, który próbuje podzielić złożone wyrazy na ich pojedyncze składniki. Jeśli użytkownik wprowadzi Ik ga naar de kleuterschool jako wypowiedź, zostanie on odwrócony do Ik ga naar de kleuter school . Zezwalanie na oznaczenie kleuter i school niezależnie jako różne jednostki. |
Niderlandzkinl-nl |
1.0.1 | Tokenizuje wyrazy, dzieląc je na spacje. Jeśli użytkownik wprowadzi Ik ga naar de kleuterschool jako wypowiedź, pozostanie pojedynczym tokenem. W ten sposób kleuterschool jest oznaczony jako pojedyncza jednostka. |
Migrowanie między wersjami tokenizatora
Tokenizacja odbywa się na poziomie aplikacji. Nie ma obsługi tokenizacji na poziomie wersji.
Zaimportuj plik jako nową aplikację zamiast wersji. Ta akcja oznacza, że nowa aplikacja ma inny identyfikator aplikacji, ale używa wersji tokenizatora określonej w pliku.