Partager via


Projets multilingues

Compréhension du langage courant vous permet d’étendre facilement votre projet à plusieurs langues en même temps. Quand vous activez plusieurs langues dans des projets, vous pouvez ajouter des énoncés et des synonymes spécifiques à la langue à votre projet, et obtenir des prédictions multilingues pour vos intentions et vos entités.

Composants des intentions et des entités apprises multilingues

Quand vous activez plusieurs langues dans un projet, vous pouvez entraîner le projet principalement dans une langue et obtenir immédiatement des prédictions dans d’autres langues.

Par exemple, vous pouvez entraîner entièrement votre projet avec des énoncés en anglais, et l’interroger en français, allemand, mandarin, japonais, coréen et d’autres langues. Compréhension du langage courant vous permet de mettre facilement à l’échelle vos projets en plusieurs langues en utilisant la technologie multilingue pour entraîner vos modèles.

Chaque fois que vous identifiez qu’une langue particulière ne fonctionne pas aussi bien que les autres langues, vous pouvez ajouter des énoncés pour cette langue dans votre projet. Dans la page Étiqueter des énoncés de Language Studio, vous pouvez sélectionner la langue de l’énoncé que vous ajoutez. Quand vous introduisez des exemples pour cette langue dans le modèle, il reçoit davantage de syntaxe de cette langue et apprend à mieux la prédire.

Vous ne devez pas nécessairement ajouter la même quantité d’énoncés pour chaque langue. Vous devez créer la majeure partie de votre projet dans une seule langue et ajouter seulement quelques énoncés dans les langues dont vous observez qu’elles ne fonctionnent pas bien. Si vous créez un projet qui est principalement en anglais et que vous commencez à le tester en français, en allemand et en espagnol, vous constaterez peut-être que l’allemand ne fonctionne pas aussi bien que les deux autres langues. Dans ce cas, envisagez d’ajouter 5 % de vos exemples anglais d’origine en allemand, d’entraîner un nouveau modèle et de tester à nouveau l’allemand. Vous devez normalement obtenir de meilleurs résultats pour les requêtes en allemand. Plus vous ajoutez d’énoncés, plus les résultats sont susceptibles d’être améliorés.

Quand vous ajoutez des données dans une autre langue, vous ne devez pas redouter qu’elles aient une incidence négative sur les autres langues.

Composants de liste et composants prédéfinis dans plusieurs langues

Les projets pour lesquels plusieurs langues sont activées vous permettent de spécifier des synonymes par langue pour chaque clé de liste. Selon la langue avec laquelle vous interrogez votre projet, vous allez obtenir les correspondances seulement pour le composant de liste avec des synonymes de cette langue. Quand vous interrogez votre projet, vous pouvez spécifier la langue dans le corps de la demande :

"query": "{query}"
"language": "{language code}"

Si vous ne fournissez pas de langue, c’est la langue par défaut de votre projet qui est utilisée. Consultez l’article sur la prise en charge des langues pour obtenir la liste des différents codes de langue.

Les composants prédéfinis sont similaires, où vous devez vous attendre à obtenir des prédictions pour les composants prédéfinis qui sont disponibles dans des langues spécifiques. La langue de la demande détermine ici aussi les composants qui tentent d’être prédits. Consultez l’article de référence sur les composants prédéfinis pour la prise en charge des langues de chaque composant prédéfini.

Étapes suivantes