Compatibilidad de lenguaje con Análisis de sentimiento y Minería de opiniones

Artículo
09/03/2024

Use este artículo para obtener información sobre qué lenguajes son compatibles con el Análisis de sentimiento y la Minería de opiniones. Tanto la API basada en la nube como los contenedores de Docker admiten los mismos lenguajes.

Compatibilidad de lenguaje con Análisis de sentimiento

Total de códigos de idioma admitidos: 94

Idioma	Código de lenguaje	Notas
Afrikáans	`af`
Albanés	`sq`
Amárico	`am`
Árabe	`ar`
Armenio	`hy`
Asamés	`as`
Azerbaiyano	`az`
Vasco	`eu`
Bielorruso (nuevo)	`be`
Bengalí	`bn`
Bosnio	`bs`
Bretón (nuevo)	`br`
Búlgaro	`bg`
Birmano	`my`
Catalán	`ca`
Chino (simplificado)	`zh-hans`	También se acepta `zh`
Chino (tradicional)	`zh-hant`
Croata	`hr`
Checo	`cs`
Danés	`da`
Neerlandés	`nl`
English	`en`
Esperanto (nuevo)	`eo`
Estonio	`et`
Filipino	`fil`
Finés	`fi`
Francés	`fr`
Gallego	`gl`
Georgiano	`ka`
Alemán	`de`
Griego	`el`
Gujarati	`gu`
Hausa (nuevo)	`ha`
Hebreo	`he`
Hindi	`hi`
Húngaro	`hu`
Indonesio	`id`
Irlandés	`ga`
Italiano	`it`
Japonés	`ja`
Javanés (nuevo)	`jv`
Canarés	`kn`
Kazajo	`kk`
Jemer	`km`
Coreano	`ko`
Kurdo (Kurmanji)	`ku`
Kirguís	`ky`
Lao	`lo`
Latín (nuevo)	`la`
Letón	`lv`
Lituano	`lt`
Macedonio	`mk`
Malgache	`mg`
Malayo	`ms`
Malayalam	`ml`
Maratí	`mr`
Mongol	`mn`
Nepalí	`ne`
Noruego	`no`
Odia	`or`
Oromo (nuevo)	`om`
Pastún	`ps`
Persa	`fa`
Polaco	`pl`
Portugués (Portugal)	`pt-PT`	También se acepta `pt`
Portugués (Brasil)	`pt-BR`
Punjabi	`pa`
Rumano	`ro`
Ruso	`ru`
Sanscrito (nuevo)	`sa`
Gaélico escocés (nuevo)	`gd`
Serbio	`sr`
Sindi (nuevo)	`sd`
Cingalés (nuevo)	`si`
Eslovaco	`sk`
Esloveno	`sl`
Somalí	`so`
Español	`es`
Sundanés (nuevo)	`su`
Swahili	`sw`
Sueco	`sv`
Tamil	`ta`
Telugu	`te`
Tailandés	`th`
Turco	`tr`
Ucraniano	`uk`
Urdu	`ur`
Uigur	`ug`
Uzbeko	`uz`
Vietnamita	`vi`
Galés	`cy`
Frisón occidental (nuevo)	`fy`
Xhosa (nuevo)	`xh`
Yidis (nuevo)	`yi`

Compatibilidad de lenguaje con Minería de opiniones

Total de códigos de idioma admitidos: 94

Idioma	Código de lenguaje	Notas
Afrikáans (nuevo)	`af`
Albanés (nuevo)	`sq`
Amárico (nuevo)	`am`
Árabe	`ar`
Armenio (nuevo)	`hy`
Asamés (nuevo)	`as`
Azerbaiyano (nuevo)	`az`
Euskera (nuevo)	`eu`
Bielorruso (nuevo)	`be`
Bengalí	`bn`
Bosnio (nuevo)	`bs`
Bretón (nuevo)	`br`
Búlgaro (nuevo)	`bg`
Birmano (nuevo)	`my`
Catalán (nuevo)	`ca`
Chino (simplificado)	`zh-hans`	También se acepta `zh`
Chino (tradicional) (nuevo)	`zh-hant`
Croata (nuevo)	`hr`
Checo (nuevo)	`cs`
Danés	`da`
Neerlandés	`nl`
English	`en`
Esperanto (nuevo)	`eo`
Estonio (nuevo)	`et`
Filipino (nuevo)	`fil`
Finés	`fi`
Francés	`fr`
Gallego (nuevo)	`gl`
Georgiano (nuevo)	`ka`
Alemán	`de`
Griego	`el`
Gujarati (nuevo)	`gu`
Hausa (nuevo)	`ha`
Hebreo (nuevo)	`he`
Hindi	`hi`
Húngaro	`hu`
Indonesio	`id`
Irlandés (nuevo)	`ga`
Italiano	`it`
Japonés	`ja`
Javanés (nuevo)	`jv`
Canarés (nuevo)	`kn`
Kazajo (nuevo)	`kk`
Jemer (nuevo)	`km`
Coreano	`ko`
Kurdo (Kurmanji)	`ku`
Kirguis (nuevo)	`ky`
Lao (nuevo)	`lo`
Latín (nuevo)	`la`
Letón (nuevo)	`lv`
Lituano (nuevo)	`lt`
Macedonio (nuevo)	`mk`
Malgache (nuevo)	`mg`
Malayo (nuevo)	`ms`
Malayálam (nuevo)	`ml`
Maratí	`mr`
Mongol (nuevo)	`mn`
Nepalí (nuevo)	`ne`
Noruego	`no`
Odia (nuevo)	`or`
Oromo (nuevo)	`om`
Pastún (nuevo)	`ps`
Persa (nuevo)	`fa`
Polaco	`pl`
Portugués (Portugal)	`pt-PT`	También se acepta `pt`
Portugués (Brasil)	`pt-BR`
Punjabi (nuevo)	`pa`
Rumano (nuevo)	`ro`
Ruso	`ru`
Sanscrito (nuevo)	`sa`
Gaélico escocés (nuevo)	`gd`
Serbio (nuevo)	`sr`
Sindi (nuevo)	`sd`
Cingalés (nuevo)	`si`
Eslovaco (nuevo)	`sk`
Esloveno (nuevo)	`sl`
Somalí (nuevo)	`so`
Español	`es`
Sundanés (nuevo)	`su`
Suajili (nuevo)	`sw`
Sueco	`sv`
Tamil	`ta`
Telugu	`te`
Tailandés (nuevo)	`th`
Turco	`tr`
Ucraniano (nuevo)	`uk`
Urdu (nuevo)	`ur`
Uigur (nuevo)	`ug`
Uzbeco (nuevo)	`uz`
Vietnamita (nuevo)	`vi`
Galés (nuevo)	`cy`
Frisón occidental (nuevo)	`fy`
Xhosa (nuevo)	`xh`
Yidis (nuevo)	`yi`

Opción multilingüe (solo análisis de sentimiento personalizado)

Con Análisis de sentimiento personalizado, puede entrenar un modelo en un idioma y usarlo para clasificar documentos en otro. Esta característica es útil porque ayuda a ahorrar tiempo y esfuerzo. En lugar de crear proyectos independientes para cada idioma, puede controlar el conjunto de datos multilingüe en un proyecto. El conjunto de datos no tiene que estar todo en el mismo idioma, pero debe habilitar la opción multilingüe para el proyecto durante la creación o posteriormente al configurarlo. Si observa que el modelo funciona de forma deficiente en determinados idiomas durante el proceso de evaluación, considere la posibilidad de agregar más datos en estos idiomas al conjunto de entrenamiento.

Puede entrenar el proyecto completamente con documentos en inglés y consultarlo en francés, alemán, mandarín, japonés, coreano y otros. El análisis de sentimiento personalizado facilita el escalado de los proyectos a varios idiomas mediante el uso de tecnología multilingüe para entrenar los modelos.

Siempre que identifique que un idioma determinado no funciona tan bien como otros, puede agregar más documentos para ese idioma en el proyecto.

No se espera que agregue la misma cantidad de documentos para cada idioma. Debe compilar la mayor parte del proyecto en un idioma y agregar solo algunos documentos en los idiomas que observe que no tienen un buen rendimiento. Si crea un proyecto que está principalmente en inglés y empieza a probarlo en francés, alemán y español, es posible que observe que en alemán no funciona tan bien como en los otros dos idiomas. En ese caso, considere la posibilidad de agregar el 5 % de los documentos originales en inglés en alemán, entrenar un modelo nuevo y volver a probarlo en alemán. Debería ver mejores resultados para las consultas en alemán. Cuantos más documentos etiquetados agregue, más probable es que mejoren los resultados.

Al agregar datos en otro idioma, no debe esperar que se produzca un efecto negativo en los otros.

Pasos siguientes

Para obtener más información, consulte cómo llamar a la API.
Inicio rápido: Uso del Análisis de sentimiento de la biblioteca cliente y la API de REST

Compartir vía

Compatibilidad de lenguaje con Análisis de sentimiento y Minería de opiniones