Compatibilidad de idiomas con el reconocimiento del lenguaje conversacional
Use este artículo para conocer los idiomas que admite actualmente la característica de la CLI.
Opción multilingüe
Sugerencia
Consulte Entrenamiento de un modelo para información sobre el modo de entrenamiento que debe usar para proyectos multilingües.
Con el reconocimiento del lenguaje conversacional, puede entrenar un modelo en un idioma y usarlo para predecir intenciones y entidades a partir de expresiones en otro idioma. Esta característica es poderosa porque ayuda a ahorrar tiempo y esfuerzo. En lugar de crear proyectos independientes para cada idioma, puede controlar el conjunto de datos multilingüe en un proyecto. El conjunto de datos no tiene que estar todo en el mismo idioma, pero debe habilitar la opción multilingüe para el proyecto durante la creación o posteriormente al configurarlo. Si observa que el modelo funciona de forma deficiente en determinados idiomas durante el proceso de evaluación, considere la posibilidad de agregar más datos en estos idiomas al conjunto de entrenamiento.
Puede entrenar el proyecto completamente con expresiones en inglés y consultarlo en francés, alemán, mandarín, japonés, coreano y otros. La comprensión del lenguaje conversacional facilita el escalado de los proyectos a varios idiomas mediante el uso de tecnología multilingüe para entrenar los modelos.
Siempre que identifique que un idioma determinado no funciona tan bien como otros, puede agregar expresiones para ese idioma en el proyecto. En la página de expresiones de etiqueta de Language Studio puede seleccionar el idioma de la expresión que va a agregar. Al introducir ejemplos de ese idioma en el modelo, se introduce más sintaxis de ese idioma y aprende a predecirlo mejor.
No se espera que agregue la misma cantidad de expresiones para cada idioma. Debe compilar la mayor parte del proyecto en un idioma y agregar solo algunas expresiones en los idiomas que observe que no tienen un buen rendimiento. Si crea un proyecto que está principalmente en inglés y empieza a probarlo en francés, alemán y español, es posible que observe que en alemán no funciona tan bien como en los otros dos idiomas. En ese caso, considere la posibilidad de agregar el 5 % de los ejemplos originales en inglés en alemán, entrenar un modelo nuevo y volver a probarlo en alemán. Debería ver mejores resultados para las consultas en alemán. Cuantas más expresiones agregue, más probable es que mejoren los resultados.
Al agregar datos en otro idioma, no debe esperar que se produzca un efecto negativo en los otros.
Componentes de lista y precompilados en varios idiomas
Los proyectos con varios idiomas habilitados le permitirán especificar sinónimos por idioma para cada clave de lista. En función del idioma con el que consulte el proyecto, solo obtendrá coincidencias para el componente de lista con sinónimos de ese idioma. Al consultar el proyecto, puede especificar el idioma en el cuerpo de la solicitud:
"query": "{query}"
"language": "{language code}"
Si no proporciona un idioma, volverá al predeterminado del proyecto.
Los componentes precompilados son similares, donde debería esperar obtener predicciones para los componentes precompilados que están disponibles en idiomas específicos. El idioma de la solicitud determina de nuevo qué componentes se intentan predecir.
Idiomas admitidos por el reconocimiento del lenguaje conversacional
El reconocimiento del lenguaje conversacional admite expresiones en los siguientes idiomas:
Idioma | Código de lenguaje |
---|---|
Afrikáans | af |
Amárico | am |
Árabe | ar |
Asamés | as |
Azerbaiyano | az |
Bielorruso | be |
Búlgaro | bg |
Bengalí | bn |
Bretón | br |
Bosnio | bs |
Catalán | ca |
Checo | cs |
Galés | cy |
Danés | da |
Alemán | de |
Griego | el |
Inglés (EE. UU.) | en-us |
English (Reino Unido) | en-gb |
Esperanto | eo |
Español | es |
Estonio | et |
Vasco | eu |
Persa | fa |
Finés | fi |
Francés | fr |
Frisón occidental | fy |
Irlandés | ga |
Gaélico escocés | gd |
Gallego | gl |
Gujarati | gu |
Hausa | ha |
Hebreo | he |
Hindi | hi |
Croata | hr |
Húngaro | hu |
Armenio | hy |
Indonesio | id |
Italiano | it |
Japonés | ja |
Javanés | jv |
Georgiano | ka |
Kazajo | kk |
Jemer | km |
Canarés | kn |
Coreano | ko |
Kurdo (Kurmanji) | ku |
Kirguís | ky |
Latín | la |
Lao | lo |
Lituano | lt |
Letón | lv |
Malgache | mg |
Macedonio | mk |
Malayalam | ml |
Mongol | mn |
Maratí | mr |
Malayo | ms |
Birmano | my |
Nepalí | ne |
Neerlandés | nl |
Noruego (bokmal) | nb |
Odia | or |
Punjabi | pa |
Polaco | pl |
Pastún | ps |
Portugués (Brasil) | pt-br |
Portugués (Portugal) | pt-pt |
Rumano | ro |
Ruso | ru |
Sánscrito | sa |
Sindhi | sd |
Cingalés | si |
Eslovaco | sk |
Esloveno | sl |
Somalí | so |
Albanés | sq |
Serbio | sr |
Sundanés | su |
Sueco | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Tailandés | th |
Filipino | tl |
Turco | tr |
Uigur | ug |
Ucraniano | uk |
Urdu | ur |
Uzbeko | uz |
Vietnamita | vi |
Xhosa | xh |
Yidis | yi |
Chino (simplificado) | zh-hans |
Chino (tradicional) | zh-hant |
Zulú | zu |