Suporte a idiomas na compreensão da linguagem coloquial
Leia este artigo para saber quais são os idiomas compatíveis com o recurso de CLU no momento.
Opção multilíngue
Dica
Veja Como treinar um modelo para saber qual modo de treinamento você deve usar em projetos multilíngues.
Com a compreensão da linguagem coloquial, você pode treinar um modelo em um idioma e usá-lo para prever intenções e entidades de enunciados em outro idioma. Esse recurso é poderoso porque ajuda a economizar tempo e esforço. Em vez de criar projetos separados para cada idioma, você lida com conjuntos de dados de vários idiomas em apenas um projeto. Seu conjunto de dados não precisa estar totalmente no mesmo idioma, mas você deve habilitar a opção multilíngue para o projeto durante a criação ou posteriormente nas configurações do projeto. Se o modelo estiver apresentando um baixo desempenho em determinados idiomas durante o processo de avaliação, considere adicionar mais dados nesses idiomas ao conjunto de treinamento.
Você pode treinar seu projeto inteiramente com enunciados em inglês e consultá-lo em: francês, alemão, mandarim, japonês, coreano e outros. O reconhecimento vocal de conversação facilita a escala de seus projetos para vários idiomas usando a tecnologia multilíngue para treinar seus modelos.
Sempre que você identificar que um idioma específico não está sendo executado, bem como outros idiomas, você pode adicionar declarações para esse idioma em seu projeto. Na página enunciados de marca no Language Studio, você pode selecionar o idioma do expressão que você está adicionando. Quando você apresenta exemplos para esse idioma para o modelo, ele é introduzida a mais da sintaxe dessa linguagem, e aprende a prever melhor.
Não é necessário adicionar a mesma quantidade de enunciados para cada idioma. Você deve criar a maioria do seu projeto em um idioma e adicionar apenas alguns enunciados em idiomas que observar não estão funcionando bem. Se você criar um projeto que esteja principalmente em inglês e começar a testá-lo em francês, alemão e espanhol, poderá observar que o alemão não é executado, bem como os outros dois idiomas. Nesse caso, considere adicionar 5% dos exemplos originais em inglês em alemão, treinar um novo modelo e testar em alemão novamente. Você deverá ver resultados melhores para consultas em alemão. Quanto mais enunciados você adicionar, maior será a probabilidade de os resultados ficarem melhores.
Quando você adiciona dados em outro idioma, não deve esperar que eles afetem negativamente outros idiomas.
Listar e criar componentes predefinidos em vários idiomas
Projetos com vários idiomas habilitados permitirão que você especifique sinônimos por idioma para cada chave de lista. Dependendo do idioma com o qual você consulta seu projeto, você só obterá correspondências para o componente da lista com sinônimos desse idioma. Ao consultar seu projeto, você pode especificar o idioma no corpo da solicitação:
"query": "{query}"
"language": "{language code}"
Se você não fornecer um idioma, ele voltará para o idioma padrão do seu projeto.
Os componentes pré-criados são semelhantes, onde você deve esperar obter previsões para componentes predefinidos que estão disponíveis em idiomas específicos. O idioma da solicitação novamente determina quais componentes estão tentando ser previstos.
Idiomas compatíveis com a compreensão da linguagem coloquial
A compreensão da linguagem coloquial dá suporte a enunciados nos seguintes idiomas:
Linguagem | Código de idioma |
---|---|
Africâner | af |
Amárico | am |
Árabe | ar |
Assamês | as |
Azerbaidjano | az |
Bielorrusso | be |
Búlgaro | bg |
Bengali | bn |
Bretão | br |
Bósnio | bs |
Catalão | ca |
Tcheco | cs |
Galês | cy |
Dinamarquês | da |
Alemão | de |
Grego | el |
Inglês (EUA) | en-us |
Inglês (Reino Unido) | en-gb |
Esperanto | eo |
Espanhol | es |
Estoniano | et |
Basco | eu |
Persa | fa |
Finlandês | fi |
Francês | fr |
Frísio ocidental | fy |
Irlandês | ga |
Gaélico escocês | gd |
Galego | gl |
Guzerate | gu |
Hausa | ha |
Hebraico | he |
Híndi | hi |
Croata | hr |
Húngaro | hu |
Armênia | hy |
Indonésio | id |
Italiano | it |
Japonês | ja |
Javanês | jv |
Georgiano | ka |
Cazaque | kk |
Khmer | km |
canarim | kn |
Coreano | ko |
Curdo (Kurmanji) | ku |
Kyrgyz | ky |
Latim | la |
Lao | lo |
Lituano | lt |
Letão | lv |
Malgaxe | mg |
Macedônio | mk |
Malaiala | ml |
Mongol | mn |
Marati | mr |
Malaio | ms |
Birmanês | my |
Nepali | ne |
Holandês | nl |
Norueguês (Bokmal) | nb |
Oriá | or |
Panjabi | pa |
Polonês | pl |
Pashto | ps |
Português (Brasil) | pt-br |
Português (Portugal) | pt-pt |
Romeno | ro |
Russo | ru |
Sânscrito | sa |
Sindhi | sd |
Sinhala | si |
Eslovaco | sk |
Esloveno | sl |
Somali | so |
Albanês | sq |
Sérvio | sr |
Sundanês | su |
Sueco | sv |
Swahili | sw |
Tâmil | ta |
Télugo | te |
Tailandês | th |
Filipino | tl |
Turco | tr |
Uyghur | ug |
Ucraniano | uk |
Urdu | ur |
Uzbek | uz |
Vietnamita | vi |
Xhosa | xh |
Iídiche | yi |
Chinês (Simplificado) | zh-hans |
Chinês (Tradicional) | zh-hant |
Zulu | zu |