Поддержка языков и регионов в LUIS

Важно!

Служба LUIS будет прекращена 1 октября 2025 г., и с 1 апреля 2023 г. вы не сможете создавать новые ресурсы LUIS. Мы рекомендуем перенести приложения LUIS на распознавание устной речи , чтобы воспользоваться непрерывной поддержкой продуктов и многоязычными возможностями.

Служба LUIS имеет широкий набор функций. Не все компоненты имеют одинаковую языковую функциональную совместимость. Убедитесь, что функции, которые вас интересуют, поддерживаются для используемого языка и региональных параметров. Приложение LUIS учитывает конкретный язык и региональные параметры, которые нельзя изменять после установки.

Многоязыковые приложения LUIS

Если вам требуется многоязыковое клиентское приложение LUIS, например, чат-бот, вам доступно несколько вариантов. Если LUIS поддерживает все языки, можно разработать приложение LUIS для каждого языка. Каждое приложение LUIS получает уникальный идентификатор приложения и журнал конечной точки. Чтобы обеспечить распознавание речи для языка, не поддерживаемого LUIS, можно использовать службу Переводчик для перевода фрагментов речи на поддерживаемый язык, отправки фрагментов в конечную точку LUIS и получения оценок.

Примечание

Новая версия возможностей Распознавание речи теперь доступна в составе языка ИИ Azure. Дополнительные сведения см. в документации по языку ИИ Azure. Сведения о возможностях распознавания речи, поддерживающих несколько языков в языковой службе, приведены в разделе Распознавание устной речи.

Поддерживаемые языки

Служба LUIS распознает фрагменты речи на следующих языках:

Язык Locale Предварительно созданная предметная область Предварительно созданная сущность Рекомендации по списку фраз **Анализ тональности и извлечение ключевых фраз
Арабский (предварительная версия — современный стандартный арабский) ar-AR - - - -
*Китайский zh-CN -
Нидерландский nl-NL - -
Английский (США) en-US
Английский (Великобритания) en-GB
Французский (Канада) fr-CA - - -
Французский (Франция) fr-FR
Немецкий de-DE
Гуджарати (предварительная версия) gu-IN - - - -
Хинди (предварительная версия) hi-IN - - -
Итальянский it-IT
*Японский ja-JP Только ключевая фраза
Корейский ko-KR - - Только ключевая фраза
Маратхи (предварительная версия) mr-IN - - - -
Португальский (Бразилия) pt-BR не все вложенные языки и региональные параметры
Испанский (Мексика) es-MX -
испанский (Испания) es-ES
Тамильский (предварительная версия) ta-IN - - - -
Телугу (предварительная версия) te-IN - - - -
Турецкий tr-TR - Только тональность

Языковая поддержка зависит от готовых сущностей и готовых предметных областей.

* Примечания о поддержке китайского языка

  • В языке и региональных параметрах zh-CN служба LUIS ожидает упрощенную кодировку китайского языка вместо традиционной кодировки.
  • Имена намерений, сущностей, свойств и регулярных выражений можно указывать китайскими или латинскими символами.
  • Сведения о поддерживаемых готовых предметных областях в языке и региональных параметрах zh-CN см. в справочнике по готовым предметным областям.

* Примечания о поддержке японского языка

  • Поскольку служба LUIS не обеспечивает синтаксический анализ и не может понять разницу между почтительной и неформальной речью, необходимо включить различные уровни формальности в качестве примеров обучения для ваших приложений.
    • でございます не равно です.
    • です не равно だ.

* * Заметки о поддержке языковой службы

Языковая служба включает в себя предварительно созданную сущность keyPhrase и анализ тональности. Вложенные языки и региональные параметры поддерживаются только для португальского языка: pt-PT и pt-BR. Все другие языки и региональные параметры поддерживаются на уровне основного языка.

Поддерживаемые языки API речи

Сведения о языках режима диктовки службы речи см. в разделе Поддерживаемые языки для службы "Речь".

Поддерживаемые языки проверки орфографии Bing

Список поддерживаемых языков и состояний см. в разделе Поддерживаемые языки проверки орфографии Bing.

Редкие или иностранные слова в приложении

В языке и региональных параметрах en-us служба LUIS обучается для определения большинства английских слов, включая сленг. В языке и региональных параметрах zh-cn служба LUIS обучается для определения большинства символов китайского языка. Если при использовании редких слов в en-us или символов в zh-cn вы понимаете, что служба LUIS не может распознать это слово или символ, их можно добавить в список фраз. Например, слова за пределами языка и региональных параметров приложения, то есть иностранные слова, следует добавить в свойство "Список фраз".

Гибридные языки

Гибридные языки объединяют слова из двух культур, например английского и китайского языка. Эти языки не поддерживаются в LUIS, так как приложение основано на одном языке.

Выделение лексем

В целях машинного обучения LUIS разбивает фрагменты речи на маркеры, в зависимости от языка и региональных параметров.

Язык каждый пробел и специальный символ уровень символа составные слова
Арабский
Китайский
Нидерландский
Английский (en-us)
Английский (en-GB)
Французский (fr-FR)
Французский (fr-CA)
Немецкий
Гуджарати
Hindi
Итальянский
Японский
Корейский
Маратхи
Португальский (Бразилия)
Испанский (es-ES)
Испанский (es-MX)
Тамильский
Телугу
Турецкий

Пользовательские версии выделителя лексем

Следующие языки и региональные параметры имеют пользовательские версии выделителя лексем:

culture Версия Цель
Немецкий
de-de
1.0.0 Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты.
Если пользователь введет Ich fahre einen krankenwagen в качестве речевого фрагмента, то получится Ich fahre einen kranken wagen. Разрешает независимую пометку kranken и wagen как разных сущностей.
Немецкий
de-de
1.0.2 Разделяет слова на лексемы, разбивая их пробелами.
Если пользователь введет Ich fahre einen krankenwagen в качестве речевого фрагмента, он остается единой лексемой. Таким образом, krankenwagen помечается как единая сущность.
Нидерландский
nl-nl
1.0.0 Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты.
Если пользователь введет Ik ga naar de kleuterschool в качестве речевого фрагмента, то получится Ik ga naar de kleuter school. Разрешает независимую пометку kleuter и school как разных сущностей.
Нидерландский
nl-nl
1.0.1 Разделяет слова на лексемы, разбивая их пробелами.
Если пользователь введет Ik ga naar de kleuterschool в качестве речевого фрагмента, он остается единой лексемой. Таким образом, kleuterschool помечается как единая сущность.

Миграция между версиями выделителя лексем

Выделение происходит на уровне приложения. Выделение лексем на уровне версии не поддерживается.

Импортируйте файл как новое приложение, а не версию. Это действие означает, что новое приложение имеет другой идентификатор приложения, но использует версию анализатора, указанную в файле.