¿Qué es Documento de inteligencia de Azure AI?

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documento de inteligencia es, de manera predeterminada, la versión 2023-10-31-preview de la API REST.
  • La versión preliminar pública 2023-10-31-preview solo está disponible en las siguientes regiones de Azure:
  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

Este contenido se aplica a:checkmarkv4.0 (versión preliminar) | Versiones anteriores:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

Este contenido se aplica a:checkmarkv3.1 (GA) | Versión más reciente:purple-checkmarkv4.0 (versión preliminar) | Versiones anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este contenido se aplica a:checkmarkv3.0 (GA) | Versiones más recientes:purple-checkmarkv4.0 (versión preliminar)purple-checkmarkv3.1 (versión preliminar) | Versión anterior:blue-checkmarkv2.1

Este contenido se aplica a:checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (versión preliminar)

Nota:

Form Recognizer ahora es Documento de inteligencia de Azure AI.

  • A partir de julio de 2023, los servicios de Azure AI engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
  • No hay ningún cambio en los precios.
  • Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
  • No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en los SDK anteriores a la versión 3.1 inclusive. A partir de la versión 4.0, las API y los SDK se actualizan a Document Intelligence.
  • Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.

Documento de inteligencia de Azure AI es un servicio de Azure AI basado en la nube que permite crear soluciones inteligentes de procesamiento de documentos. Grandes cantidades de datos, que abarcan una amplia variedad de tipos de datos, se almacenan en formularios y documentos. Documento de inteligencia permite administrar eficazmente la velocidad a la que se recopilan y procesan los datos y es clave para mejorar las operaciones, tomar decisiones fundamentadas en datos e impulsar la innovación.

| ✔️ Modelos de análisis de documentos | ✔️ Modelos precompilados | ✔️ Modelos personalizados |

Modelos de análisis de documentos

Los modelos de análisis de documentos permiten la extracción de texto de formularios y documentos y devuelven contenido estructurado listo para el uso o el progreso de la organización.


Lectura | Extracción de texto impreso
y manuscrito.


Diseño | Extracción de texto, tablas
y estructura del documento.


Lectura | Extracción de texto impreso
y manuscrito.


Diseño | Extracción de texto, tablas
y estructura del documento.


Documento general | Extracción del texto,
estructura, pares clave-valor.

Modelos creados previamente

Los modelos precompilados permiten agregar procesamiento de documentos inteligente a las aplicaciones y los flujos sin necesidad de entrenar ni compilar modelos propios.


Factura | Extracción de los detalles del cliente
y del proveedor.


Recibo | Extracción de los detalles de la
transacción de ventas.


Identidad | Extracción de los detalles de identificación
y verificación.


Tarjeta de seguro médico | Extracción de los detalles
seguro médico.


Contrato | Extracción de los detalles del acuerdo
y de las partes.


Formulario W-2 de impuestos de EE. UU. | Extraer detalles de compensación tributables
.


Formulario de impuestos estadounidenses 1098 | Extracción de los detalles de interés de la hipoteca.


Formulario de impuestos estadounidenses 1098-E | Extracción de detalles de interés de préstamos estudiantiles.


Formulario de impuestos estadounidenses 1098-T | Extracción de los detalles de la matrícula calificada.


Formulario fiscal de EE. UU 1099 | Extracción de información de las variaciones del formulario 1099.


Factura | Extracción de los detalles del cliente
y del proveedor.


Recibo | Extracción de los detalles de la
transacción de ventas.


Identidad | Extracción de los detalles de identificación
y verificación.


Tarjeta de seguro médico | Extracción de los detalles del seguro médico.


Tarjeta de presentación | Extracción de la información de contacto empresarial.


Contrato | Extracción de los detalles del acuerdo
y de las partes.


Formulario W-2 de impuestos de EE. UU. | Extraer detalles de compensación tributables
.


Formulario de impuestos estadounidenses 1098 | Extracción de los detalles de interés de la hipoteca.


Formulario de impuestos estadounidenses 1098-E | Extracción de detalles de interés de préstamos estudiantiles.


Formulario de impuestos estadounidenses 1098-T | Extracción de los detalles de la matrícula calificada.

Modelos personalizados

  • Los modelos personalizados se entrenan mediante los conjuntos de datos etiquetados para extraer datos distintos de formularios y documentos, específicos de los casos de uso.
  • Los modelos personalizados independientes se pueden combinar para crear modelos compuestos.
  • Modelos de extracción
    ✔️ Los modelos de extracción personalizados se entrenan para extraer campos etiquetados de documentos.


Plantilla personalizada | Extracción de datos de diseños estáticos.


Neuronal personalizada | Extracción de datos de documentos de tipo mixto.


Compuesto personalizado | Extracción de datos mediante una colección de modelos.

  • Modelo de clasificación
    ✔️ Los clasificadores personalizados identifican los tipos de documento antes de invocar un modelo de extracción.


Clasificador personalizado | Identificación de los tipos de documento designados (clases)
antes de solicitar un modelo de extracción.

Funcionalidades de complementos

Document Intelligence admite características opcionales que se pueden habilitar y deshabilitar en función del escenario de extracción de documentos. Las siguientes funcionalidades de complemento están disponibles para 2023-07-31 (GA) y versiones posteriores:

Document Intelligence admite características opcionales que se pueden habilitar y deshabilitar en función del escenario de extracción de documentos. Las siguientes funcionalidades de complemento están disponibles para 2023-10-31-preview y versiones posteriores:

Características de análisis

Id. de modelo Extracción de contenido Párrafos Roles de párrafo Marcas de selección Tablas Pares clave de valor Idiomas Códigos de barras Análisis de documentos Fórmulas* Fuente de estilo* Alta resolución* Campos de consulta
prebuilt-read O O O O O
diseño preelaborado O O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
Recibo precompilado O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(Variaciones) O O O O O
contrato precompilado O O O O O
{ customModelName } O O O O O
prebuilt-document (
2023-10-31-preview
en desuso)
O O O O O
prebuilt-businessCard (
2023-10-31-preview
en desuso)

✓ - Habilitado
O: Opcional
* - Las características Premium incurren en costos adicionales.

Modelos y opciones de desarrollo

Nota:

El servicio Documento de inteligencia v3.0 admite los siguientes modelos de comprensión de documentos y opciones de desarrollo.

Puede usar Documento de inteligencia para automatizar el procesamiento de documentos en aplicaciones y flujos de trabajo, mejorar las estrategias basadas en datos y enriquecer las capacidades de búsqueda de documentos. Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las opciones de desarrollo.

Lectura

Screenshot of Read model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-read ● Extracción de texto de documentos.
Extracción de datos
● Digitalización de cualquier documento.
● Cumplimiento y auditoría.
●● Procesamiento de notas manuscritas antes de la traducción.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Layout

Screenshot of the layout model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
diseño preelaborado ● Extracción de información de texto y diseño de documentos.
Extracción de datos
● Indexación y recuperación de documentos por estructura.
● Análisis de informes financieros y médicos.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Documento general (en desuso en 2023-10-31-preview)

Screenshot of General Document model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-document ● Extracción de texto, diseño y pares clave-valor de los documentos.
Extracción de datos y campos
● Extracción de pares clave-valor.
● Procesamiento de formularios.
● Recopilación y análisis de datos de encuestas.
Studio de Documento de inteligencia
API de REST

Factura

Screenshot of Invoice model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-invoice ● Extracción de información clave de las facturas.
Extracción de datos y campos
● Procesamiento de cuentas pagaderos.
● Registro e informes fiscales automatizados.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Recibo

Screenshot of Receipt model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
Recibo precompilado ● Extracción de información clave de los recibos.
Extracción de datos y campos
● El modelo de recibo v3.0 admite el procesamiento de recibos de hotel de página única.
● Administración de gastos.
● Análisis de datos de comportamiento del consumidor.
● Programa de fidelidad del cliente.
● Procesamiento de devolución de mercancías.
● Registro e informes fiscales automatizados.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Identidad (ID)

Screenshot of Identity (ID) Document model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-idDocument ● Extracción de información clave de pasaportes y tarjetas de identificación.
Tipos de documentos
● Extracción de aprobaciones, restricciones y clasificaciones de vehículos de licencias de conductores de EE. UU.
● Conozca el cumplimiento de las directrices de servicios financieros del cliente (KYC).
● Administración de cuentas médicas.
● Puntos de control de identidad y puertas de enlace.
● Registro de hoteles.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Tarjeta de seguro de salud

Screenshot of Health insurance card model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-healthInsuranceCard.us ● Extracción de información clave de las tarjetas de seguro médico de EE. UU.
Extracción de datos y campos
● Cobertura y verificación de idoneidad.
● Modelado predictivo.
● Análisis basado en valores.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Modelo de contrato

Screenshot of Contract model extraction using Document Intelligence Studio.

Id. de modelo Descripción Opciones de desarrollo
prebuilt-contract Extraer los detalles del acuerdo y de las partes. Studio de Documento de inteligencia
API de REST

Modelo W-2 fiscal de EE. UU.

Screenshot of W-2 model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-tax.us.W-2 ● Extracción de información clave de formularios fiscales de IRS W2 de EE. UU. (año 2018 a 2021).
Extracción de datos y campos
● Administración automatizada de documentos fiscales.
● Procesamiento de solicitudes de préstamos hipotecas.
Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Formulario de impuestos estadounidenses 1098

Screenshot of US 1098 tax form analyzed in the Document Intelligence Studio.

Id. de modelo Descripción Opciones de desarrollo
prebuilt-tax.us.1098 Extraer información y detalles de interés de hipoteca. Studio de Documento de inteligencia
API de REST

Formulario de impuestos estadounidenses 1098-E

Screenshot of US 1098-E tax form analyzed in the Document Intelligence Studio.

Id. de modelo Descripción Opciones de desarrollo
prebuilt-tax.us.1098E Extraer información y detalles de préstamos estudiantiles. Studio de Documento de inteligencia
API de REST

Formulario de impuestos estadounidenses 1098-T

Screenshot of US 1098-T tax form analyzed in the Document Intelligence Studio.

Id. de modelo Descripción Opciones de desarrollo
prebuilt-tax.us.1098T Extraer información y detalles de matrícula. Studio de Documento de inteligencia
API de REST

Formulario de impuestos estadounidenses 1099 (y variaciones)

Screenshot of US 1099 tax form analyzed in the Document Intelligence Studio.

Id. de modelo Descripción Opciones de desarrollo
prebuilt-tax.us.1099(Variaciones) Extracción de información de variaciones del formulario 1099. Studio de Documento de inteligencia
API de REST

Tarjeta de presentación

Screenshot of Business card model analysis using Document Intelligence Studio.

Id. de modelo Descripción Casos de uso de Automation Opciones de desarrollo
prebuilt-businessCard ● Extracción de información clave de las tarjetas de presentación.
Extracción de datos y campos
● Administración de clientes potenciales y marketing. Studio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
JavaScript

Modelo personalizado (información general)

Screenshot of Custom model training using Document Intelligence Studio.

Acerca de Descripción Casos de uso de Automation Opciones de desarrollo
Modelo personalizado Extraer información de formularios y documentos en datos estructurados basados en un modelo creado a partir de un conjunto de documentos de entrenamiento representativos. Extraer datos concretos de formularios y documentos específicos de la empresa y casos de uso. Document Intelligence Studio
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Plantilla personalizada

Screenshot of Custom Template model analysis using Document Intelligence Studio.

Nota:

Para entrenar un modelo de plantilla personalizada, se debe establecer la buildMode propiedad en template. Para obtener más información, consulteEntrenamiento de un modelo de plantilla

Acerca de Descripción Casos de uso de Automation Opciones de desarrollo
Modelo de plantilla personalizada El modelo de plantilla personalizada extrae valores y campos etiquetados de documentos estructurados y semiestructurados.
Extraer datos clave de documentos altamente estructurados con plantillas visuales definidas o diseños visuales comunes, formularios. Document Intelligence Studio
API de REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript

Neuronal personalizado

Screenshot of Custom Neural model analysis using Document Intelligence Studio.

Nota:

Para entrenar un modelo neuronal personalizado, se debe establecer la propiedad buildMode en neural. Para obtener más información, consulteEntrenamiento de un modelo neuronal

Acerca de Descripción Casos de uso de Automation Opciones de desarrollo
Modelo neuronal personalizado El modelo neuronal personalizado se usa para extraer datos etiquetados de documentos estructurados (encuestas, cuestionarios), semiestructurados (facturas, pedidos de compra) y no estructurados (contratos, cartas). Extraer datos de texto, casillas y campos tabulares de documentos estructurados y no estructurados. Document Intelligence Studio
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Compuesto personalizado

Screenshot of Composed Custom model list in Document Intelligence Studio.

Acerca de Descripción Casos de uso de Automation Opciones de desarrollo
Modelos personalizados compuestos El modelo compuesto se crea tomando una colección de modelos personalizados y asignándolos a un único modelo creado a partir de los tipos de formulario. Resulta de utilidad cuando se entrenan varios modelos y se quieren agrupar para analizar tipos de formulario parecidos como órdenes de compra. Document Intelligence Studio
API de REST
SDK de C#
SDK de Java
SDK de JavaScript
SDK de Python

Modelos de clasificación personalizados

{alt-text}

Acerca de Descripción Casos de uso de Automation Opciones de desarrollo
Modelos de clasificación compuestos Los modelos de clasificación personalizados combinan características de diseño y lenguaje para detectar, identificar y clasificar documentos dentro de un archivo de entrada. ● Un paquete de solicitud de préstamo que contiene el formulario de solicitud, los pagos y el extracto bancario.
● Una colección de facturas escaneadas.
Studio de Documento de inteligencia
API de REST

Documento de inteligencia de Azure AI es un servicio de Azure AI basado en la nube para que los desarrolladores creen soluciones inteligentes de procesamiento de documentos. Documento de inteligencia aplica el reconocimiento óptico de caracteres (OCR) basado en aprendizaje automático y las tecnologías de comprensión de documentos para extraer texto, tablas, estructura y pares clave-valor de los documentos. También puede etiquetar y entrenar modelos personalizados para automatizar la extracción de datos de documentos estructurados, semiestructurados y no estructurados. Para más información sobre cada modelo, consulte los artículos de conceptos:

Tipo de modelo Nombre del modelo
Modelos de análisis de documentos Modelo de análisis de diseño
Modelos creados previamente Modelo de factura
Modelo de recibo
Modelo de documento de identidad (id.)
Modelo de tarjeta de visita
Modelos personalizados Modelo personalizado
Modelo compuesto

Este contenido se aplica a:checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (versión preliminar)

Modelos de inteligencia de documentos y opciones de desarrollo

Sugerencia

  • Para obtener una experiencia mejorada y una calidad avanzada del modelo, pruebe Studio de Documento de inteligencia v3.0.
  • La versión 3.0 de Studio admite cualquier modelo entrenado con datos etiquetados de la versión 2.1.
  • Puede consultar la guía de migración de API para obtener información detallada sobre la migración de la versión 2.1 a la 3.0.

Nota:

El servicio de Documento de inteligencia v2.1 admite los siguientes modelos y opciones de desarrollo.

Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las referencias de API:

Modelo Descripción Opciones de desarrollo
Análisis de diseño Extracción y análisis de texto, marcas de selección, tablas, y coordenadas de rectángulo de selección de formularios y documentos. Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de la biblioteca cliente
Contenedor Docker de Documento de inteligencia
Modelo personalizado Extracción y análisis de datos de formularios y documentos específicos de distintos datos empresariales y casos de uso. Herramienta de etiquetado de Documento de inteligencia
API de REST
Herramienta de etiquetado de ejemplo
Contenedor Docker de Documento de inteligencia
Modelo de factura Procesamiento automatizado de datos y extracción de información clave de facturas. Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia
Modelo de recibo Procesamiento automatizado de datos y extracción de información clave de recibos de compra. Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia
Modelo de documento de identidad (id.) Procesamiento automatizado de datos y extracción de información clave de permisos de conducir de EE. UU. y pasaportes internacionales. Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia
Modelo de tarjeta de presentación Procesamiento automatizado de datos y extracción de información clave de tarjetas de presentación. Herramienta de etiquetado de Documento de inteligencia
API de REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia

Seguridad y privacidad de datos

Al igual que con todos los servicios de IA, los desarrolladores que usan el servicio de Documento de inteligencia deben estar al tanto de las directivas de Microsoft sobre los datos de los clientes. Consulte la página Datos, privacidad y seguridad para Documento de inteligencia.

Pasos siguientes