Translate
PROBLEMA DE TEXTOS NO RECONOCIDOS O DATOS INCORRECTOS EN AZURE - DOCUMENT INTELLIGENCE
Estamos experimentando inconvenientes con los modelos de IA de Azure, específicamente con el módulo "Custom Extraction Model", donde entrenamos nuestros modelos para la lectura de facturas. Hemos notado que, luego de cierto tiempo, los modelos comienzan a perder precisión de manera progresiva, hasta el punto de dejar de reconocer algunos campos o valores previamente identificados. Como solución, hemos reentrenado los modelos, pero en algunos casos ya lo hemos realizado hasta 5 veces, lo que afecta la viabilidad del proyecto debido al tiempo invertido y no resuelve el inconveniente. Detalles adicionales: • La pérdida de precisión ocurre de forma aleatoria, sin patrones identificables, los modelos dejan de reconocer información que anteriormente se identificaba correctamente. • Los ID modelos permanecen disponibles, lo que indica que el entrenamiento no se elimina ni se reinicia automáticamente. • La pérdida de precisión ocurre directamente en Document Intelligence, la respuesta de la API coincide con la respuesta que nos arroja cuando utilizando la interfaz de usuario por lo que podríamos descartar un error en la petición. * el bot identifica con mas de 100 modelos distintos, y este problema solo se presenta en algunos de ellos (siempre en los mismos) * no se presenta por antiguedad, primero en los mas viejos y luego en los mas nuevos Agrego el procedimiento de cómo estamos entrenando los modelo:
- Acceder a la página web: https://documentintelligence.ai.azure.com/studio
- Ingresar las credenciales del usuario de desarrollo las credenciales están en KeePass
- Ir al módulo “Custom Extraction Model”.
- Abrir el proyecto correspondiente.
- Dentro del proyecto, dirigirse a la sección “Label Data”. a. Si hay archivos previamente cargados, se eliminan antes de comenzar un nuevo entrenamiento.
- Subir los archivos con los que se desea entrenar el modelo. (Actualmente, utilizamos un mínimo de 10 archivos del mismo tipo de factura para cada entrenamiento.)
- Etiquetar los datos necesarios para cada archivo. (Los tipos de datos que utilizamos habitualmente son: “Field” y “Table”.)
- Una vez finalizado el etiquetado, presionar el botón “TRAIN”.
- En la ventana emergente “Train a new model”: a. Escribir el nombre para el Model ID. b. La descripción habitualmente se deja vacía. c. Seleccionar la opción Neural en el campo Build Mode. d. Presionar el botón Train.
- Finaliza Podrian ayudarnos con esto?