Compatibilidad de idiomas de Text Analytics for Health personalizado
Use este artículo para conocer los idiomas admitidos actualmente en Text Analytics for Health personalizado.
Opción multilingüe
Con Text Analytics for Health personalizado, puede entrenar un modelo en un idioma y usarlo para extraer entidades de documentos en otros idiomas. Esta característica le ahorra el problema de tener que crear proyectos independientes para cada idioma y, en su lugar, le permite combinar los conjuntos de datos en un solo proyecto, lo que facilita el escalado de proyectos a varios idiomas. Puede entrenar el proyecto completamente con documentos en inglés y consultarlo en francés, alemán, italiano y otros. Puede habilitar la opción multilingüe como parte del proceso de creación del proyecto o posteriormente, a través de la configuración del proyecto.
No se espera que agregue la misma cantidad de documentos para cada idioma. Debe compilar la mayor parte del proyecto en un idioma y agregar solo algunos documentos en los idiomas que observe que no tienen un buen rendimiento. Si crea un proyecto que está principalmente en inglés y empieza a probarlo en francés, alemán y español, es posible que observe que en alemán no funciona tan bien como en los otros dos idiomas. En ese caso, considere la posibilidad de agregar el 5 % de los documentos originales en inglés en alemán, entrenar un modelo nuevo y volver a probarlo en alemán. En la página de etiquetado de datos de Language Studio puede seleccionar el idioma del documento que va a agregar. Debería ver mejores resultados para las consultas en alemán. Cuantos más documentos etiquetados agregue, más probable es que mejoren los resultados. Al agregar datos en otro idioma, no debe esperar que se produzca un efecto negativo en los otros.
El hebreo no se admite en proyectos multilingües. Si el idioma principal del proyecto es hebreo, no podrá agregar datos de entrenamiento en otros idiomas ni consultar el modelo con otros idiomas. Del mismo modo, si el idioma principal del proyecto no es hebreo, no podrá agregar datos de entrenamiento en hebreo ni consultar el modelo en hebreo.
Compatibilidad con idiomas
Text Analytics for Health personalizado admite .txt
archivos en los siguientes idiomas:
Idioma | Código de lenguaje |
---|---|
Inglés | en |
Francés | fr |
Alemán | de |
Español | es |
Italiano | it |
Portugués (Portugal) | pt-pt |
Hebreo | he |