Поделиться через


Многоязычные проекты

Распознавание устной речи упрощает расширение проекта до нескольких языков. Если вы включите несколько языков в проектах, вы сможете добавлять в проект речевые фрагменты и синонимы для конкретных языков и получать многоязычные прогнозы для своих намерений и сущностей.

Компоненты многоязычного намерения и изученных сущностей

Когда вы включаете несколько языков в проекте, вы можете обучать проект преимущественно на одном языке и сразу же получать прогнозы на других.

Например, вы можете полностью обучить свой проект речевым фрагментам на английском языке и запрашивать его на французском, немецком, китайском, японском, корейском и других языках. Распознавание устной речи позволяет легко масштабировать проекты до нескольких языков, используя многоязычную технологию для обучения моделей.

Когда вы обнаружите, что определенный язык работает не так хорошо, как другие языки, вы можете добавить речевые фрагменты для этого языка в свой проект. На странице Добавление тегов к речевым фрагментам в Language Studio вы можете выбрать язык добавляемого речевого фрагмента. Когда вы предоставляете примеры для этого языка для модели, она знакомится с более подробным синтаксисом этого языка и учится предсказывать его лучше.

Вы не должны добавлять одинаковое количество речевых фрагментов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить лишь несколько речевых фрагментов на тех языках, которые работают не очень хорошо. Если вы создадите проект преимущественно на английском языке и начнете тестировать его на французском, немецком и испанском языках, вы можете заметить, что немецкий язык работает не так хорошо, как два других языка. В этом случае попробуйте добавить 5% исходных английских примеров на немецком языке, обучите новую модель и снова протестируйте на немецком языке. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше речевых фрагментов вы добавите, тем больше вероятность того, что результаты станут лучше.

Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.

Перечисление и предварительное создание компонентов на нескольких языках

Проекты с поддержкой нескольких языков позволяют указывать синонимы для каждого языка для каждого ключа списка. В зависимости от языка, на котором вы запрашиваете свой проект, вы получите только совпадения для компонента списка с синонимами этого языка. При выполнении запроса проекта можно указать язык в тексте запроса.

"query": "{query}"
"language": "{language code}"

Если язык не указан, будет возвращен язык по умолчанию для проекта. Список различных кодов языков см. в статье Поддержка языков.

Предварительно созданные компоненты аналогичны, и вы должны ожидать получения прогнозов для предварительно созданных компонентов, доступных на определенных языках. Язык запроса снова определяет, какие компоненты следует прогнозировать. Дополнительные сведения о языковой поддержке каждого предварительно созданного компонента см. в справочной статье Предварительно созданные компоненты.

Следующие шаги