Suporte ao idioma de mineração de opiniões e Análise de Sentimento

Use este artigo para saber quais linguagens têm suporte pela Análise de Sentimento e Mineração de Opiniões. A API baseada em nuvem e os contêineres do Docker dão suporte às mesmas linguagens.

Suporte ao idioma da Análise de Sentimento

Códigos de idiomas totais com suporte: 94

Linguagem Código de idioma Observações
Africâner af
Albanês sq
Amárico am
Árabe ar
Armênia hy
Assamês as
Azerbaidjano az
Basco eu
Bielorrusso (novo) be
Bengali bn
Bósnio bs
Bretão (novo) br
Búlgaro bg
Birmanês my
Catalão ca
Chinês (Simplificado) zh-hans zh também é aceito
Chinês (Tradicional) zh-hant
Croata hr
Tcheco cs
Dinamarquês da
Holandês nl
Inglês en
Esperanto (novo) eo
Estoniano et
Filipino fil
Finlandês fi
Francês fr
Galego gl
Georgiano ka
Alemão de
Grego el
Guzerate gu
Hauçá (novo) ha
Hebraico he
Híndi hi
Húngaro hu
Indonésio id
Irlandês ga
Italiano it
Japonês ja
Javanês (novo) jv
canarim kn
Cazaque kk
Khmer km
Coreano ko
Curdo (Kurmanji) ku
Kyrgyz ky
Lao lo
Latim (novo) la
Letão lv
Lituano lt
Macedônio mk
Malgaxe mg
Malaio ms
Malaiala ml
Marati mr
Mongol mn
Nepali ne
Norueguês no
Oriá or
Oromo (novo) om
Pashto ps
Persa fa
Polonês pl
Português (Portugal) pt-PT pt também é aceito
Português (Brasil) pt-BR
Panjabi pa
Romeno ro
Russo ru
Sânscrito (novo) sa
Gaélico escocês (novo) gd
Sérvio sr
Sindi (novo) sd
Cingalês (novo) si
Eslovaco sk
Esloveno sl
Somali so
Espanhol es
Sundanês (novo) su
Swahili sw
Sueco sv
Tâmil ta
Télugo te
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Uyghur ug
Uzbek uz
Vietnamita vi
Galês cy
Frísio ocidental (novo) fy
isiXhosa (novo) xh
Iídiche (novo) yi

Suporte ao idioma da mineração de opiniões

Códigos de idiomas totais com suporte: 94

Linguagem Código de idioma Observações
Africâner (novo) af
Albanês (novo) sq
Amárico (novo) am
Árabe ar
Armênio (novo) hy
Assamês (novo) as
Azerbaijano (novo) az
Basco (novo) eu
Bielorrusso (novo) be
Bengali bn
Bósnio (novo) bs
Bretão (novo) br
Búlgaro (novo) bg
Birmanês (novo) my
Catalão (novo) ca
Chinês (simplificado) zh-hans zh também é aceito
Chinês (tradicional) (novo) zh-hant
Croata (novo) hr
Tcheco (novo) cs
Dinamarquês da
Holandês nl
Inglês en
Esperanto (novo) eo
Estoniano (novo) et
Filipino (novo) fil
Finlandês fi
Francês fr
Galego (novo) gl
Georgiano (novo) ka
Alemão de
Grego el
Guzerate (novo) gu
Hauçá (novo) ha
Hebraico (novo) he
Híndi hi
Húngaro hu
Indonésio id
Irlandês (novo) ga
Italiano it
Japonês ja
Javanês (novo) jv
Canarim (novo) kn
Cazaque (novo) kk
Khmer (novo) km
Coreano ko
Curdo (Kurmanji) ku
Quirguiz (novo) ky
Laosiano (novo) lo
Latim (novo) la
Letão (novo) lv
Lituano (novo) lt
Macedônio (novo) mk
Malgaxe (novo) mg
Malaio (novo) ms
Malaiala (novo) ml
Marati mr
Mongol (novo) mn
Nepalês (novo) ne
Norueguês no
Oriá (novo) or
Oromo (novo) om
Pashto (novo) ps
Persa (novo) fa
Polonês pl
Português (Portugal) pt-PT pt também é aceito
Português (Brasil) pt-BR
Panjabi (novo) pa
Romeno (novo) ro
Russo ru
Sânscrito (novo) sa
Gaélico escocês (novo) gd
Sérvio (novo) sr
Sindi (novo) sd
Cingalês (novo) si
Eslovaco (novo) sk
Esloveno (novo) sl
Somali (novo) so
Espanhol es
Sundanês (novo) su
Suaíli (novo) sw
Sueco sv
Tâmil ta
Télugo te
Tailandês (novo) th
Turco tr
Ucraniano (novo) uk
Urdu (novo) ur
Uigur (novo) ug
Uzbeque (novo) uz
Vietnamita (novo) vi
Galês (novo) cy
Frísio ocidental (novo) fy
isiXhosa (novo) xh
Iídiche (novo) yi

Opção multilíngue (somente análise de sentimento personalizada)

Com a análise de sentimento personalizada, você pode treinar um modelo em um idioma e usá-lo para classificar documentos em outro idioma. Esse recurso é útil porque ajuda a economizar tempo e esforço. Em vez de criar projetos separados para cada idioma, você lida com conjuntos de dados de vários idiomas em apenas um projeto. Seu conjunto de dados não precisa estar totalmente no mesmo idioma, mas você deve habilitar a opção multilíngue para o projeto durante a criação ou posteriormente nas configurações do projeto. Se o modelo estiver apresentando um baixo desempenho em determinados idiomas durante o processo de avaliação, considere adicionar mais dados nesses idiomas ao conjunto de treinamento.

Você pode treinar seu projeto inteiramente com documentos em inglês e consultá-lo em: francês, alemão, mandarim, japonês, coreano e outros. A análise de sentimento personalizada facilita o escalonamento de seus projetos para vários idiomas usando a tecnologia multilíngue para treinar seus modelos.

Sempre que você identificar que um idioma específico não está sendo executado, bem como outros idiomas, você pode adicionar documentos para esse idioma em seu projeto.

Você não precisa adicionar a mesma quantidade de documentos para cada idioma. Você deve criar a maioria do seu projeto em um idioma e adicionar apenas alguns documentos em idiomas que observar não estão funcionando bem. Se você criar um projeto que esteja principalmente em inglês e começar a testá-lo em francês, alemão e espanhol, poderá observar que o alemão não é executado, bem como os outros dois idiomas. Nesse caso, considere adicionar 5% dos documentos originais em inglês em alemão, treinar um novo modelo e testar em alemão novamente. Você deverá ver resultados melhores para consultas em alemão. Quanto mais documentos rotulados você adicionar, maior será a probabilidade de aprimoramento dos resultados.

Quando você adiciona dados em outro idioma, não deve esperar que eles afetem negativamente outros idiomas.

Próximas etapas