Compartir a través de


Inteligencia documental compuesta por modelos personalizados

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo. Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documento de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-07-31-preview.
  • La versión preliminar pública 2024-07-31-preview solo está disponible en las siguientes regiones de Azure. Tenga en cuenta que el modelo generativo personalizado (extracción de campos del documento) en AI Studio solo está disponible en la región Centro-norte de EE. UU.:
    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
    • Centro-Norte de EE. UU

Este contenido se aplica a: marca de verificación v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.1 (GA) marca de verificación azul v3.0 (GA) marca de verificación azul v2.1 (GA)

Este contenido se aplica a: marca de verificación v3.1 (GA) | Última versión: marca de verificación púrpura v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.0 marca de verificación azul v2.1

Este contenido se aplica a: marca de verificación v3.0 (GA) | Últimas versiones: marca de verificación púrpura v4.0 (versión preliminar) marca de verificación púrpura v3.1 | Versión anterior: marca de verificación azul v2.1

Este contenido se aplica a: marca de verificación v2.1 | Versión más reciente: marca de verificación azul v4.0 (versión preliminar)

Importante

El comportamiento de la operación model compose cambia de api-version=2024-07-31-preview. La operación model compose v4.0 y versiones posteriores agrega un clasificador entrenado explícitamente en lugar de un clasificador implícito para su análisis. Para la versión anterior del modelo compuesto, consulte Modelos personalizados compuestos v3.1. Si actualmente usa modelos compuestos, considere la posibilidad de actualizar a la implementación más reciente.

¿Qué es un modelo compuesto?

Con los modelos compuestos, puede agrupar varios modelos personalizados en un modelo compuesto llamado con un único identificador de modelo. Por ejemplo, el modelo compuesto puede incluir modelos personalizados entrenados para analizar sus pedidos de compra de suministros, equipos y mobiliario. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.

Algunos escenarios requieren clasificar primero el documento y, a continuación, analizarlo con el modelo más adecuado para extraer los campos del modelo. Estos escenarios pueden incluir aquellos en los que un usuario carga un documento, pero el tipo de documento no se conoce explícitamente. Otro escenario puede ser cuando se examinan varios documentos conjuntamente en un solo archivo y este se envía para su procesamiento. A continuación, la aplicación debe identificar los documentos de componentes y seleccionar el mejor modelo para cada documento.

En versiones anteriores, la operación model compose realizó una clasificación implícita para decidir qué modelo personalizado representa mejor el documento enviado. La implementación 2024-07-31-preview de la operación model compose reemplaza la clasificación implícita de las versiones anteriores por un paso de clasificación explícita y agrega el enrutamiento condicional.

Ventajas de la nueva operación de redacción del modelo

La nueva operación model compose requiere que entrene un clasificador explícito y proporciona varias ventajas.

  • Mejora incremental continua. Puede mejorar de forma coherente la calidad del clasificador mediante la adición de más ejemplos y la mejora incremental de la clasificación. Este ajuste preciso garantiza que los documentos se enruten siempre al modelo adecuado para la extracción.

  • Control completo sobre el enrutamiento. Al agregar un enrutamiento basado en confianza, se proporciona un umbral de confianza para el tipo de documento y la respuesta de clasificación.

  • Omisión de tipos de documentos específicos del documento durante la operación. Las implementaciones anteriores de la operación model compose seleccionaron el mejor modelo de análisis para la extracción en función de la puntuación de confianza, incluso si las puntuaciones de confianza más altas eran relativamente bajas. Al proporcionar un umbral de confianza o no asignar explícitamente un tipo de documento conocido desde la clasificación a un modelo de extracción, puede omitir tipos de documentos específicos.

  • Análisis de varias instancias del mismo tipo de documento. Cuando se empareja con la opción splitMode del clasificador, la operación model compose puede detectar varias instancias del mismo documento en un archivo y dividir el archivo para procesar cada documento de forma independiente. El uso de splitMode permite el procesamiento de varias instancias de un documento en una sola solicitud.

  • Compatibilidad con las características del complemento. Características del complemento tales como campos de consulta o códigos de barras también se pueden especificar como parte de los parámetros del modelo de análisis.

  • Máximo de modelos personalizados asignados expandido a 500. La nueva implementación de la operación model compose permite asignar hasta 500 modelos personalizados entrenados a un solo modelo compuesto.

Cómo usar la composición de modelos

  • Empiece por recopilar ejemplos de todos los documentos necesarios, incluidos ejemplos con información que se debe extraer u omitir.

  • Entrene un clasificador mediante la organización de los documentos en carpetas donde los nombres de carpeta son el tipo de documento que tiene previsto usar en la definición del modelo compuesto.

  • Por último, entrene un modelo de extracción para cada uno de los tipos de documento que tenga previsto usar.

  • Una vez entrenados los modelos de clasificación y extracción, use Document Intelligence Studio, bibliotecas cliente o la API REST para componer los modelos de clasificación y extracción en un modelo compuesto.

Use el parámetro splitMode para controlar el comportamiento de división de archivos:

  • Ninguno. Todo el archivo se trata como un solo documento.
  • perPage. Cada página del archivo se trata como un documento independiente.
  • auto. El archivo se divide automáticamente en documentos.

Precios y facturación

Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas por el modelo de análisis de bajada. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Con la adición de la clasificación explícita, se generan cargos por la clasificación de todas las páginas en el archivo de entrada. Para más información, consulte la página de precios de Documento de inteligencia.

Uso de la operación de redacción del modelo

  • Empiece por crear una lista de todos los identificadores de modelo que desea redactar en un solo modelo.

  • Redacte los modelos en un identificador de modelo único mediante las bibliotecas cliente, API REST o Studio.

  • Use el identificador de modelo compuesto para analizar documentos.

Facturación

Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Para más información, consulte la página de precios de Documento de inteligencia.

  • No hay cambios en los precios por analizar un documento usando un modelo personalizado individual o un modelo personalizado compuesto.

Características de modelos compuestos

  • Los modelos Custom template y custom neural pueden componer un único modelo compuesto en varias versiones de API.

  • La respuesta incluye una propiedad docType para indicar cuál de los modelos compuestos se usó a fin de analizar el documento.

  • En el caso de los modelos custom template, el modelo compuesto se puede crear mediante variaciones de una plantilla personalizada o distintos tipos de formulario. Esta operación resulta útil cuando los formularios de entrada pertenecen a una de varias plantillas.

  • En el caso de los modelos custom neural, el procedimiento recomendado es agregar todas las diferentes variaciones de un único tipo de documento en un único conjunto de datos de entrenamiento y entrenar con un modelo neuronal personalizado. La operación model compose es más adecuada para escenarios en los que se envían documentos de diferentes tipos para su análisis.

Límites del modelo compuesto

  • Con la operación model compose, puede asignar hasta 500 modelos a un identificador de modelo único. Si el número de modelos que quiero componer supera el límite superior de un modelo compuesto, puede usar una de estas alternativas:

  • El análisis de un documento mediante modelos compuestos es idéntico al análisis de un documento mediante un único modelo. El Analyze Documentresultado devuelve una docType propiedad que indica cuál de los modelos de componentes ha seleccionado para analizar el documento.

  • Actualmente, la operación model compose solo está disponible para los modelos personalizados entrenados con etiquetas.

Compatibilidad con el modelo compuesto

Tipo de modelo personalizado Modelos entrenados con v2.1 y v2.0 Modelos neuronales y de plantilla personalizados v3.1 y v3.0 Modelos neuronales y de plantilla personalizados v4.0 (versión predeterminada) Modelos generativos personalizados v4.0 (versión predeterminada)
Modelos entrenados con la versión 2.1 y v2.0 No compatible No compatible No compatible No compatible
Modelos neuronales y de plantilla personalizados v3.0 y v3.1 No compatible Compatible Admitido No compatible
Modelos neuronales y de plantilla personalizados v4.0 (versión predeterminada) No compatible Compatible Admitido No compatible
Modelos generativos personalizados v4.0 (versión predeterminada) No compatible No compatible No compatible No compatible
  • Para crear un modelo entrenado con una versión anterior de la API (v2.1 o anterior), entrene un modelo con la API v3.0 usando el mismo conjunto de datos etiquetado. Esa incorporación garantiza que el modelo v2.1 se pueda componer con otros modelos.

  • Con los modelos compuestos mediante la versión 2.1 de la API sigue siendo compatible, sin necesidad de actualizaciones.

Opciones de desarrollo

Documento de inteligencia v4.0:2024-07-31-preview admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python
Modelo compuesto Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Documento de inteligencia v3.1:2023-07-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python
Modelo compuesto Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Documento de inteligencia v3.0:2022-08-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python
Modelo compuesto Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Document Intelligence v2.1 admite los siguientes recursos:

Característica Recursos
Modelo personalizado Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia
Modelo compuesto Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de C#
SDK de Java
• SDK de JavaScript
SDK de Python

Pasos siguientes

Aprenda a crear y componer modelos personalizados: