Partekatu honen bidez:


Modelo de plantilla personalizada de Documento de inteligencia

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo. Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documento de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-07-31-preview.
  • La versión preliminar pública 2024-07-31-preview solo está disponible en las siguientes regiones de Azure. Tenga en cuenta que el modelo generativo personalizado (extracción de campos del documento) en AI Studio solo está disponible en la región Centro-norte de EE. UU.:
    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
    • Centro-Norte de EE. UU

Este contenido se aplica a: marca de verificación v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.1 (GA) marca de verificación azul v3.0 (GA) marca de verificación azul v2.1 (GA)

Este contenido se aplica a: marca de verificación v3.1 (GA) | Última versión: marca de verificación púrpura v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.0 marca de verificación azul v2.1

Este contenido se aplica a: marca de verificación v3.0 (GA) | Últimas versiones: marca de verificación púrpura v4.0 (versión preliminar) marca de verificación púrpura v3.1 | Versión anterior: marca de verificación azul v2.1

Este contenido se aplica a: marca de verificación v2.1 | Versión más reciente: marca de verificación azul v4.0 (versión preliminar)

El modelo personalizado (antes formulario personalizado) es un modelo de documento fácil de entrenar que extrae con precisión pares clave-valor etiquetados, marcas de selección, tablas, regiones y firmas de los documentos. Los modelos de plantilla usan indicaciones de diseño para extraer valores de documentos y son adecuados para extraer campos de documentos muy estructurados con plantillas visuales definidas.

Los modelos de plantilla personalizados comparten el mismo formato y estrategia de etiquetado que los modelos neuronales personalizados, con compatibilidad con más tipos de campo e idiomas.

Funcionalidades del modelo

Los modelos de plantilla personalizados admiten pares clave-valor, marcas de selección, tablas, campos de firma y regiones seleccionadas.

Campos de formulario Marcas de selección Campos tabulares (tablas) Firma Regiones seleccionadas Campos superpuestos
Compatible Admitido Admitido Admitido Admitido No compatible

Campos tabulares

Con el lanzamiento de las versiones v3.0 y posteriores de la API, los modelos de plantilla personalizados agregarán compatibilidad con campos tabulares (tablas) entre páginas:

  • Para etiquetar una tabla que abarca varias páginas, etiquete cada fila de la tabla en las distintas páginas de una sola tabla.
  • Como procedimiento recomendado, asegúrese de que el conjunto de datos contiene algunas muestras de las variaciones esperadas. Por ejemplo, incluya ejemplos en los que toda la tabla se encuentra en una sola página y en los las tablas abarcan dos o más páginas si espera ver esas variaciones en los documentos.

Los campos tabulares también son útiles al extraer información repetida dentro de un documento que no se reconoce como una tabla. Por ejemplo, una sección repetida de experiencias de trabajo en un currículum se puede etiquetar y extraer como un campo tabular.

Gestión de las variaciones

Los modelos de plantilla se basan en una plantilla visual definida; los cambios en la plantilla darán lugar a una menor precisión. En esos casos, divida el conjunto de datos de entrenamiento para incluir al menos cinco muestras de cada plantilla y entrenar un modelo para cada una de las variaciones. A continuación, puede crear los modelos en un único punto de conexión. En el caso de variaciones sutiles, como imágenes y documentos PDF digitales, es mejor incluir al menos cinco ejemplos de cada tipo en el mismo conjunto de datos de entrenamiento.

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Leer
    Layout ✔ (2024-02-29, 2023-10-31 o posteriores)
    Documento general
    Creada previamente
    Personalizado

    ✱ Los archivos de Microsoft Office no se admiten actualmente para otros modelos o versiones.

  • Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones de entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente 8texto de punto a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

  • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 G-MB para el modelo neuronal.

  • Para el modelo de entrenamiento de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

Training a model

Los modelos de plantilla personalizados están disponibles con carácter general a partir de la API v2.0 y versiones posteriores. Si va a empezar con un nuevo proyecto o tiene un conjunto de datos etiquetado existente, use la API v3.1 o v3.0 con Documento de inteligencia Studio para entrenar un modelo de plantilla personalizado.

Modelo API DE REST SDK Etiquetado y prueba de modelos
Plantilla personalizada API v3.1 SDK de Documento de inteligencia Document Intelligence Studio

Con la API v3.0 y posteriores, la operación de compilación para entrenar el modelo admite una nueva propiedad buildMode. Para entrenar un modelo de plantilla personalizado, establezca buildMode en template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Los modelos de plantilla personalizados están disponibles con carácter general con la API v3.1. Si va a empezar con un nuevo proyecto o tiene un conjunto de datos etiquetado existente, use la API v3.1 o v3.0 con Documento de inteligencia Studio para entrenar un modelo de plantilla personalizado.

Modelo API DE REST SDK Etiquetado y prueba de modelos
Plantilla personalizada API v3.1 SDK de Documento de inteligencia Document Intelligence Studio

Con la API v3.0 y posteriores, la operación de compilación para entrenar el modelo admite una nueva propiedad buildMode. Para entrenar un modelo de plantilla personalizado, establezca buildMode en template.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas y configuraciones regionales compatibles

Consulte nuestra página de Compatibilidad de idiomas: modelos personalizados para obtener una lista completa de los idiomas admitidos.

Los modelos de plantilla personalizados están disponibles con carácter general con la API v2.1.

Modelo API DE REST SDK Etiquetado y prueba de modelos
Modelo personalizado (plantilla) Documento de inteligencia 2.1 SDK de Documento de inteligencia Herramienta de etiquetado de ejemplo de Documento de inteligencia

Pasos siguientes

Aprenda a crear y componer modelos personalizados: