Compatibilidad de lenguaje con Análisis de sentimiento y Minería de opiniones

Use este artículo para obtener información sobre qué lenguajes son compatibles con el Análisis de sentimiento y la Minería de opiniones. Tanto la API basada en la nube como los contenedores de Docker admiten los mismos lenguajes.

Compatibilidad de lenguaje con Análisis de sentimiento

Total de códigos de idioma admitidos: 94

Idioma Código de lenguaje Notas
Afrikáans af
Albanés sq
Amárico am
Árabe ar
Armenio hy
Asamés as
Azerbaiyano az
Vasco eu
Bielorruso (nuevo) be
Bengalí bn
Bosnio bs
Bretón (nuevo) br
Búlgaro bg
Birmano my
Catalán ca
Chino (simplificado) zh-hans También se acepta zh
Chino (tradicional) zh-hant
Croata hr
Checo cs
Danés da
Neerlandés nl
English en
Esperanto (nuevo) eo
Estonio et
Filipino fil
Finés fi
Francés fr
Gallego gl
Georgiano ka
Alemán de
Griego el
Gujarati gu
Hausa (nuevo) ha
Hebreo he
Hindi hi
Húngaro hu
Indonesio id
Irlandés ga
Italiano it
Japonés ja
Javanés (nuevo) jv
Canarés kn
Kazajo kk
Jemer km
Coreano ko
Kurdo (Kurmanji) ku
Kirguís ky
Lao lo
Latín (nuevo) la
Letón lv
Lituano lt
Macedonio mk
Malgache mg
Malayo ms
Malayalam ml
Maratí mr
Mongol mn
Nepalí ne
Noruego no
Odia or
Oromo (nuevo) om
Pastún ps
Persa fa
Polaco pl
Portugués (Portugal) pt-PT También se acepta pt
Portugués (Brasil) pt-BR
Punjabi pa
Rumano ro
Ruso ru
Sanscrito (nuevo) sa
Gaélico escocés (nuevo) gd
Serbio sr
Sindi (nuevo) sd
Cingalés (nuevo) si
Eslovaco sk
Esloveno sl
Somalí so
Español es
Sundanés (nuevo) su
Swahili sw
Sueco sv
Tamil ta
Telugu te
Tailandés th
Turco tr
Ucraniano uk
Urdu ur
Uigur ug
Uzbeko uz
Vietnamita vi
Galés cy
Frisón occidental (nuevo) fy
Xhosa (nuevo) xh
Yidis (nuevo) yi

Compatibilidad de lenguaje con Minería de opiniones

Total de códigos de idioma admitidos: 94

Idioma Código de lenguaje Notas
Afrikáans (nuevo) af
Albanés (nuevo) sq
Amárico (nuevo) am
Árabe ar
Armenio (nuevo) hy
Asamés (nuevo) as
Azerbaiyano (nuevo) az
Euskera (nuevo) eu
Bielorruso (nuevo) be
Bengalí bn
Bosnio (nuevo) bs
Bretón (nuevo) br
Búlgaro (nuevo) bg
Birmano (nuevo) my
Catalán (nuevo) ca
Chino (simplificado) zh-hans También se acepta zh
Chino (tradicional) (nuevo) zh-hant
Croata (nuevo) hr
Checo (nuevo) cs
Danés da
Neerlandés nl
English en
Esperanto (nuevo) eo
Estonio (nuevo) et
Filipino (nuevo) fil
Finés fi
Francés fr
Gallego (nuevo) gl
Georgiano (nuevo) ka
Alemán de
Griego el
Gujarati (nuevo) gu
Hausa (nuevo) ha
Hebreo (nuevo) he
Hindi hi
Húngaro hu
Indonesio id
Irlandés (nuevo) ga
Italiano it
Japonés ja
Javanés (nuevo) jv
Canarés (nuevo) kn
Kazajo (nuevo) kk
Jemer (nuevo) km
Coreano ko
Kurdo (Kurmanji) ku
Kirguis (nuevo) ky
Lao (nuevo) lo
Latín (nuevo) la
Letón (nuevo) lv
Lituano (nuevo) lt
Macedonio (nuevo) mk
Malgache (nuevo) mg
Malayo (nuevo) ms
Malayálam (nuevo) ml
Maratí mr
Mongol (nuevo) mn
Nepalí (nuevo) ne
Noruego no
Odia (nuevo) or
Oromo (nuevo) om
Pastún (nuevo) ps
Persa (nuevo) fa
Polaco pl
Portugués (Portugal) pt-PT También se acepta pt
Portugués (Brasil) pt-BR
Punjabi (nuevo) pa
Rumano (nuevo) ro
Ruso ru
Sanscrito (nuevo) sa
Gaélico escocés (nuevo) gd
Serbio (nuevo) sr
Sindi (nuevo) sd
Cingalés (nuevo) si
Eslovaco (nuevo) sk
Esloveno (nuevo) sl
Somalí (nuevo) so
Español es
Sundanés (nuevo) su
Suajili (nuevo) sw
Sueco sv
Tamil ta
Telugu te
Tailandés (nuevo) th
Turco tr
Ucraniano (nuevo) uk
Urdu (nuevo) ur
Uigur (nuevo) ug
Uzbeco (nuevo) uz
Vietnamita (nuevo) vi
Galés (nuevo) cy
Frisón occidental (nuevo) fy
Xhosa (nuevo) xh
Yidis (nuevo) yi

Opción multilingüe (solo análisis de sentimiento personalizado)

Con Análisis de sentimiento personalizado, puede entrenar un modelo en un idioma y usarlo para clasificar documentos en otro. Esta característica es útil porque ayuda a ahorrar tiempo y esfuerzo. En lugar de crear proyectos independientes para cada idioma, puede controlar el conjunto de datos multilingüe en un proyecto. El conjunto de datos no tiene que estar todo en el mismo idioma, pero debe habilitar la opción multilingüe para el proyecto durante la creación o posteriormente al configurarlo. Si observa que el modelo funciona de forma deficiente en determinados idiomas durante el proceso de evaluación, considere la posibilidad de agregar más datos en estos idiomas al conjunto de entrenamiento.

Puede entrenar el proyecto completamente con documentos en inglés y consultarlo en francés, alemán, mandarín, japonés, coreano y otros. El análisis de sentimiento personalizado facilita el escalado de los proyectos a varios idiomas mediante el uso de tecnología multilingüe para entrenar los modelos.

Siempre que identifique que un idioma determinado no funciona tan bien como otros, puede agregar más documentos para ese idioma en el proyecto.

No se espera que agregue la misma cantidad de documentos para cada idioma. Debe compilar la mayor parte del proyecto en un idioma y agregar solo algunos documentos en los idiomas que observe que no tienen un buen rendimiento. Si crea un proyecto que está principalmente en inglés y empieza a probarlo en francés, alemán y español, es posible que observe que en alemán no funciona tan bien como en los otros dos idiomas. En ese caso, considere la posibilidad de agregar el 5 % de los documentos originales en inglés en alemán, entrenar un modelo nuevo y volver a probarlo en alemán. Debería ver mejores resultados para las consultas en alemán. Cuantos más documentos etiquetados agregue, más probable es que mejoren los resultados.

Al agregar datos en otro idioma, no debe esperar que se produzca un efecto negativo en los otros.

Pasos siguientes