Inteligencia documental compuesta por modelos personalizados
Importante
- Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo. Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
- La versión preliminar pública de las bibliotecas cliente de Documento de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-07-31-preview.
- La versión preliminar pública 2024-07-31-preview solo está disponible en las siguientes regiones de Azure. Tenga en cuenta que el modelo generativo personalizado (extracción de campos del documento) en AI Studio solo está disponible en la región Centro-norte de EE. UU.:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
- Centro-Norte de EE. UU
Este contenido se aplica a: v4.0 (versión preliminar) | Versiones anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este contenido se aplica a: v3.1 (GA) | Última versión: v4.0 (versión preliminar) | Versiones anteriores: v3.0 v2.1
Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (versión preliminar) v3.1 | Versión anterior: v2.1
Este contenido se aplica a: v2.1 | Versión más reciente: v4.0 (versión preliminar)
Importante
El comportamiento de la operación model compose
cambia de api-version=2024-07-31-preview. La operación model compose
v4.0 y versiones posteriores agrega un clasificador entrenado explícitamente en lugar de un clasificador implícito para su análisis. Para la versión anterior del modelo compuesto, consulte Modelos personalizados compuestos v3.1. Si actualmente usa modelos compuestos, considere la posibilidad de actualizar a la implementación más reciente.
¿Qué es un modelo compuesto?
Con los modelos compuestos, puede agrupar varios modelos personalizados en un modelo compuesto llamado con un único identificador de modelo. Por ejemplo, el modelo compuesto puede incluir modelos personalizados entrenados para analizar sus pedidos de compra de suministros, equipos y mobiliario. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.
Algunos escenarios requieren clasificar primero el documento y, a continuación, analizarlo con el modelo más adecuado para extraer los campos del modelo. Estos escenarios pueden incluir aquellos en los que un usuario carga un documento, pero el tipo de documento no se conoce explícitamente. Otro escenario puede ser cuando se examinan varios documentos conjuntamente en un solo archivo y este se envía para su procesamiento. A continuación, la aplicación debe identificar los documentos de componentes y seleccionar el mejor modelo para cada documento.
En versiones anteriores, la operación model compose
realizó una clasificación implícita para decidir qué modelo personalizado representa mejor el documento enviado. La implementación 2024-07-31-preview
de la operación model compose
reemplaza la clasificación implícita de las versiones anteriores por un paso de clasificación explícita y agrega el enrutamiento condicional.
Ventajas de la nueva operación de redacción del modelo
La nueva operación model compose
requiere que entrene un clasificador explícito y proporciona varias ventajas.
Mejora incremental continua. Puede mejorar de forma coherente la calidad del clasificador mediante la adición de más ejemplos y la mejora incremental de la clasificación. Este ajuste preciso garantiza que los documentos se enruten siempre al modelo adecuado para la extracción.
Control completo sobre el enrutamiento. Al agregar un enrutamiento basado en confianza, se proporciona un umbral de confianza para el tipo de documento y la respuesta de clasificación.
Omisión de tipos de documentos específicos del documento durante la operación. Las implementaciones anteriores de la operación
model compose
seleccionaron el mejor modelo de análisis para la extracción en función de la puntuación de confianza, incluso si las puntuaciones de confianza más altas eran relativamente bajas. Al proporcionar un umbral de confianza o no asignar explícitamente un tipo de documento conocido desde la clasificación a un modelo de extracción, puede omitir tipos de documentos específicos.Análisis de varias instancias del mismo tipo de documento. Cuando se empareja con la opción
splitMode
del clasificador, la operaciónmodel compose
puede detectar varias instancias del mismo documento en un archivo y dividir el archivo para procesar cada documento de forma independiente. El uso desplitMode
permite el procesamiento de varias instancias de un documento en una sola solicitud.Compatibilidad con las características del complemento. Características del complemento tales como campos de consulta o códigos de barras también se pueden especificar como parte de los parámetros del modelo de análisis.
Máximo de modelos personalizados asignados expandido a 500. La nueva implementación de la operación
model compose
permite asignar hasta 500 modelos personalizados entrenados a un solo modelo compuesto.
Cómo usar la composición de modelos
Empiece por recopilar ejemplos de todos los documentos necesarios, incluidos ejemplos con información que se debe extraer u omitir.
Entrene un clasificador mediante la organización de los documentos en carpetas donde los nombres de carpeta son el tipo de documento que tiene previsto usar en la definición del modelo compuesto.
Por último, entrene un modelo de extracción para cada uno de los tipos de documento que tenga previsto usar.
Una vez entrenados los modelos de clasificación y extracción, use Document Intelligence Studio, bibliotecas cliente o la API REST para componer los modelos de clasificación y extracción en un modelo compuesto.
Use el parámetro splitMode
para controlar el comportamiento de división de archivos:
- Ninguno. Todo el archivo se trata como un solo documento.
- perPage. Cada página del archivo se trata como un documento independiente.
- auto. El archivo se divide automáticamente en documentos.
Precios y facturación
Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas por el modelo de análisis de bajada. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Con la adición de la clasificación explícita, se generan cargos por la clasificación de todas las páginas en el archivo de entrada. Para más información, consulte la página de precios de Documento de inteligencia.
Uso de la operación de redacción del modelo
Empiece por crear una lista de todos los identificadores de modelo que desea redactar en un solo modelo.
Redacte los modelos en un identificador de modelo único mediante las bibliotecas cliente, API REST o Studio.
Use el identificador de modelo compuesto para analizar documentos.
Facturación
Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Para más información, consulte la página de precios de Documento de inteligencia.
- No hay cambios en los precios por analizar un documento usando un modelo personalizado individual o un modelo personalizado compuesto.
Características de modelos compuestos
Los modelos
Custom template
ycustom neural
pueden componer un único modelo compuesto en varias versiones de API.La respuesta incluye una propiedad
docType
para indicar cuál de los modelos compuestos se usó a fin de analizar el documento.En el caso de los modelos
custom template
, el modelo compuesto se puede crear mediante variaciones de una plantilla personalizada o distintos tipos de formulario. Esta operación resulta útil cuando los formularios de entrada pertenecen a una de varias plantillas.En el caso de los modelos
custom neural
, el procedimiento recomendado es agregar todas las diferentes variaciones de un único tipo de documento en un único conjunto de datos de entrenamiento y entrenar con un modelo neuronal personalizado. La operaciónmodel compose
es más adecuada para escenarios en los que se envían documentos de diferentes tipos para su análisis.
Límites del modelo compuesto
Con la operación
model compose
, puede asignar hasta 500 modelos a un identificador de modelo único. Si el número de modelos que quiero componer supera el límite superior de un modelo compuesto, puede usar una de estas alternativas:Clasifique los documentos antes de llamar al modelo personalizado. Puede usar el Modelo de lectura y compilar una clasificación basada en el texto extraído de los documentos y determinadas frases mediante orígenes como código, expresiones regulares o búsqueda.
Si desea extraer los mismos campos de varios documentos estructurados, semiestructurados y no estructurados, considere la posibilidad de usar el aprendizaje profundo modelo neuronal personalizado. Obtenga más información sobre las diferencias de entre el modelo de plantilla personalizada y el modelo neuronal personalizado.
El análisis de un documento mediante modelos compuestos es idéntico al análisis de un documento mediante un único modelo. El
Analyze Document
resultado devuelve unadocType
propiedad que indica cuál de los modelos de componentes ha seleccionado para analizar el documento.Actualmente, la operación
model compose
solo está disponible para los modelos personalizados entrenados con etiquetas.
Compatibilidad con el modelo compuesto
Tipo de modelo personalizado | Modelos entrenados con v2.1 y v2.0 | Modelos neuronales y de plantilla personalizados v3.1 y v3.0 | Modelos neuronales y de plantilla personalizados v4.0 (versión predeterminada) | Modelos generativos personalizados v4.0 (versión predeterminada) |
---|---|---|---|---|
Modelos entrenados con la versión 2.1 y v2.0 | No compatible | No compatible | No compatible | No compatible |
Modelos neuronales y de plantilla personalizados v3.0 y v3.1 | No compatible | Compatible | Admitido | No compatible |
Modelos neuronales y de plantilla personalizados v4.0 (versión predeterminada) | No compatible | Compatible | Admitido | No compatible |
Modelos generativos personalizados v4.0 (versión predeterminada) | No compatible | No compatible | No compatible | No compatible |
Para crear un modelo entrenado con una versión anterior de la API (v2.1 o anterior), entrene un modelo con la API v3.0 usando el mismo conjunto de datos etiquetado. Esa incorporación garantiza que el modelo v2.1 se pueda componer con otros modelos.
Con los modelos compuestos mediante la versión 2.1 de la API sigue siendo compatible, sin necesidad de actualizaciones.
Opciones de desarrollo
Documento de inteligencia v4.0:2024-07-31-preview admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos |
---|---|
Modelo personalizado | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Modelo compuesto | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Documento de inteligencia v3.1:2023-07-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos |
---|---|
Modelo personalizado | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Modelo compuesto | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Documento de inteligencia v3.0:2022-08-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos |
---|---|
Modelo personalizado | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Modelo compuesto | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Document Intelligence v2.1 admite los siguientes recursos:
Característica | Recursos |
---|---|
Modelo personalizado | ● Herramienta de etiquetado de Documento de inteligencia ● API de REST ● SDK de biblioteca cliente ● Contenedor Docker de Documento de inteligencia |
Modelo compuesto | • Herramienta de etiquetado de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python |
Pasos siguientes
Aprenda a crear y componer modelos personalizados: