¿Qué es Documento de inteligencia de Azure AI?
Importante
- Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
- Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
- La versión preliminar pública de las bibliotecas cliente de Documentación de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-02-29-preview.
- La versión preliminar pública 2024-02-29-preview solo está disponible en las siguientes regiones de Azure:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
Este contenido se aplica a: v4.0 (versión preliminar) | Versiones anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este contenido se aplica a: v3.1 (GA) | Última versión: v4.0 (versión preliminar) | Versiones anteriores: v3.0 v2.1
Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (versión preliminar) v3.1 | Versión anterior: v2.1
Este contenido se aplica a: v2.1 | Última versión: v4.0 (versión preliminar)
Nota:
Form Recognizer ahora es Documento de inteligencia de Azure AI.
- A partir de julio de 2023, los servicios de Azure AI engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
- No hay ningún cambio en los precios.
- Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
- No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en los SDK anteriores a la versión 3.1 inclusive. A partir de la versión 4.0, las API y los SDK se actualizan a Document Intelligence.
- Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.
Documento de inteligencia de Azure AI es un servicio de Azure AI basado en la nube que permite crear soluciones inteligentes de procesamiento de documentos. Grandes cantidades de datos, que abarcan una amplia variedad de tipos de datos, se almacenan en formularios y documentos. Documento de inteligencia permite administrar eficazmente la velocidad a la que se recopilan y procesan los datos y es clave para mejorar las operaciones, tomar decisiones fundamentadas en datos e impulsar la innovación.
| ✔️ Modelos de análisis de documentos | ✔️ Modelos precompilados | ✔️ Modelos personalizados |
Modelos de análisis de documentos
Los modelos de análisis de documentos habilitan la extracción de texto de formularios y documentos y devuelven contenido estructurado listo para la empresa para la acción, el uso o el desarrollo de su organización.
Lectura | Extracción de texto impreso
y manuscrito.
Diseño | Extracción de texto, tablas
y estructura del documento.
Lectura | Extracción de texto impreso
y manuscrito.
Diseño | Extracción de texto, tablas
y estructura del documento.
Documento general | Extracción del texto,
estructura, pares clave-valor.
Modelos creados previamente
Los modelos precompilados permiten agregar procesamiento de documentos inteligente a las aplicaciones y los flujos sin necesidad de entrenar ni compilar modelos propios.
Factura | Extracción de los detalles del cliente y del proveedor.
Recibo | Extracción de los detalles de la transacción de ventas.
Identidad | Extraiga los detalles de comprobación.
Hipoteca estadounidense 1003 | Extraiga los detalles de la solicitud de préstamo.
Hipoteca estadounidense 1008 | Extraer detalles de transmisión de préstamos.
Divulgación de hipotecas de EE. UU. | Extraiga los términos finales del préstamo de cierre.
Tarjeta de seguro de salud | Extraiga los detalles de la cobertura de seguros.
Contrato | Extracción de los detalles del acuerdo y de las partes.
Tarjeta de crédito/débito | Extraiga la información de la tarjeta de pago.
Certificado de matrimonio | Extraiga la información certificada del matrimonio.
Formulario W-2 de impuestos de EE. UU. | Extraer detalles de compensación tributables.
Formulario de impuestos estadounidenses 1098 | Extracción de los detalles de interés de la hipoteca.
Formulario de impuestos estadounidenses 1098-E | Extracción de detalles de interés de préstamos estudiantiles.
Formulario de impuestos estadounidenses 1098-T | Extracción de los detalles de la matrícula calificada.
Formulario de impuestos estadounidenses 1099 | Extraiga los detalles de variación del formulario 1099.
Formulario de impuestos de EE. UU. 1040 | Extraiga los detalles de variación del formulario 1040.
Factura | Extracción de los detalles del cliente
y del proveedor.
Recibo | Extracción de los detalles de la
transacción de ventas.
Identidad | Extracción de los detalles de identificación
y verificación.
Tarjeta de seguro médico | Extracción de los detalles del seguro médico.
Tarjeta de presentación | Extracción de la información de contacto empresarial.
Contrato | Extracción de los detalles del acuerdo
y de las partes.
Formulario W-2 de impuestos de EE. UU. | Extraer detalles de compensación tributables
.
Formulario de impuestos estadounidenses 1098 | Extracción de los detalles de interés de la hipoteca.
Formulario de impuestos estadounidenses 1098-E | Extracción de detalles de interés de préstamos estudiantiles.
Formulario de impuestos estadounidenses 1098-T | Extracción de los detalles de la matrícula calificada.
Modelos personalizados
- Los modelos personalizados se entrenan mediante los conjuntos de datos etiquetados para extraer datos distintos de formularios y documentos, específicos de los casos de uso.
- Los modelos personalizados independientes se pueden combinar para crear modelos compuestos.
- Modelos de extracción
✔️ Los modelos de extracción personalizados se entrenan para extraer campos etiquetados de documentos.
Plantilla personalizada | Extracción de datos de diseños estáticos.
Neuronal personalizada | Extracción de datos de documentos de tipo mixto.
Compuesto personalizado | Extracción de datos mediante una colección de modelos.
- Modelo de clasificación
✔️ Los clasificadores personalizados identifican los tipos de documento antes de invocar un modelo de extracción.
Clasificador personalizado | Identificación de los tipos de documento designados (clases)
antes de solicitar un modelo de extracción.
Funcionalidades de complementos
Document Intelligence admite características opcionales que se pueden habilitar y deshabilitar en función del escenario de extracción de documentos. Las siguientes funcionalidades de complemento están disponibles para 2023-07-31 (GA)
y versiones posteriores:
Document Intelligence admite características opcionales que se pueden habilitar y deshabilitar en función del escenario de extracción de documentos. Las siguientes funcionalidades de complemento están disponibles para 2024-02-29-preview
, 2023-10-31-preview
y versiones posteriores:
Características de análisis
Id. de modelo | Extracción de contenido | Campos de consulta | Párrafos | Roles de párrafo | Marcas de selección | Tablas | Pares clave de valor | Idiomas | Códigos de barras | Análisis de documentos | Fórmulas* | Fuente de estilo* | Alta resolución* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | O | O | O | O | O | |||||||
diseño preelaborado | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
prebuilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
contrato precompilado | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-invoice | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
Recibo precompilado | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(variaciones) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(variations) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Habilitado
O: Opcional
* - Las características Premium incurren en costos adicionales
Modelos y opciones de desarrollo
Nota:
El servicio Documento de inteligencia v3.0 admite los siguientes modelos de comprensión de documentos y opciones de desarrollo.
Puede usar Documento de inteligencia para automatizar el procesamiento de documentos en aplicaciones y flujos de trabajo, mejorar las estrategias basadas en datos y enriquecer las capacidades de búsqueda de documentos. Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las opciones de desarrollo.
Lectura
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-read | ● Extracción de texto de documentos. ● Extracción de datos |
● Digitalización de cualquier documento. ● Cumplimiento y auditoría. ●● Procesamiento de notas manuscritas antes de la traducción. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Layout
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
diseño preelaborado | ● Extracción de información de texto y diseño de documentos. ● Extracción de datos |
● Indexación y recuperación de documentos por estructura. ● Análisis de informes financieros y médicos. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Documento general (en desuso en 2023-10-31-preview)
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-document | ● Extracción de texto, diseño y pares clave-valor de los documentos. ● Extracción de datos y campos |
● Extracción de pares clave-valor. ● Procesamiento de formularios. ● Recopilación y análisis de datos de encuestas. |
● Studio de Documento de inteligencia ● API de REST |
Factura
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-invoice | ● Extracción de información clave de las facturas. ● Extracción de datos y campos |
● Procesamiento de cuentas pagaderos. ● Registro e informes fiscales automatizados. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Recibo
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Recibo precompilado | ● Extracción de información clave de los recibos. ● Extracción de datos y campos ● El modelo de recibo v3.0 admite el procesamiento de recibos de hotel de página única. |
● Administración de gastos. ● Análisis de datos de comportamiento del consumidor. ● Programa de fidelidad del cliente. ● Procesamiento de devolución de mercancías. ● Registro e informes fiscales automatizados. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Identidad (ID)
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-idDocument | ● Extracción de información clave de pasaportes y tarjetas de identificación. ● Tipos de documentos ● Extracción de aprobaciones, restricciones y clasificaciones de vehículos de licencias de conductores de EE. UU. |
● Conozca el cumplimiento de las directrices de servicios financieros del cliente (KYC). ● Administración de cuentas médicas. ● Puntos de control de identidad y puertas de enlace. ● Registro de hoteles. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de hipoteca de EE. UU. 1003
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-mortgage.us.1003 | ● Extraiga información clave de 1003 solicitudes de préstamo. ● Extracción de datos y campos |
● Requisitos de documentación de Fannie Mae y Freddie Mac. | ● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de hipoteca estadounidense 1008
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● Extraiga información clave de la suscripción uniforme y resumen de transmisión. ● Extracción de datos y campos |
● Procesamiento de escritura de préstamos mediante datos de resumen. | ● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de divulgación de hipotecas de EE. UU.
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● Extraiga información clave de la suscripción uniforme y resumen de transmisión. ● Extracción de datos y campos |
● Requisitos finales del préstamo hipotecado. | ● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Tarjeta de seguro de salud
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● Extracción de información clave de las tarjetas de seguro médico de EE. UU. ● Extracción de datos y campos |
● Cobertura y verificación de idoneidad. ● Modelado predictivo. ● Análisis basado en valores. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Modelo de contrato
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-contract | Extraiga los detalles del contrato y de la parte. ● Extracción de datos y campos |
● Estudio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript ● JavaScript |
Modelo de tarjeta de crédito
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-creditCard | Extraer los detalles del acuerdo y de las partes. ● Extracción de datos y campos |
● Estudio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript ● JavaScript |
Modelo de certificado de matrimonio
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-marriageCertificate.us | Extraer los detalles del acuerdo y de las partes. ● Extracción de datos y campos |
● Estudio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript ● JavaScript |
Modelo W-2 fiscal de EE. UU.
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-tax.us.W-2 | ● Extracción de información clave de formularios fiscales de IRS W2 de EE. UU. (año 2018 a 2021). ● Extracción de datos y campos |
● Administración automatizada de documentos fiscales. ● Procesamiento de solicitudes de préstamos hipotecas. |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de impuestos estadounidenses 1098
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-tax.us.1098 | Extraer información y detalles de interés de hipoteca. ● Extracción de datos y campos |
● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de impuestos estadounidenses 1098-E
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-tax.us.1098E | Extraer información y detalles de préstamos estudiantiles. ● Extracción de datos y campos |
● Studio de Documento de inteligencia ● ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de impuestos estadounidenses 1098-T
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-tax.us.1098T | Extraer información y detalles de matrícula. ● Extracción de datos y campos |
● Studio de Documento de inteligencia ● API de REST |
Formulario de impuestos estadounidenses 1099 (y variaciones)
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-tax.us.1099{variation } |
Extracción de información de variaciones del formulario 1099. | ● ● Extracción de datos y campos Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Formulario de impuestos estadounidenses 1040
Id. de modelo | Descripción | Opciones de desarrollo |
---|---|---|
prebuilt-tax.us.1040 | Extracción de información de variaciones del formulario 1040. | ● ● Extracción de datos y campos Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Tarjeta de presentación
Id. de modelo | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
prebuilt-businessCard | ● Extracción de información clave de las tarjetas de presentación. ● Extracción de datos y campos |
● Administración de clientes potenciales y marketing. | ● Studio de Documento de inteligencia ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● JavaScript |
Modelo personalizado (información general)
Acerca de | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Modelo personalizado | Extraer información de formularios y documentos en datos estructurados basados en un modelo creado a partir de un conjunto de documentos de entrenamiento representativos. | Extraer datos concretos de formularios y documentos específicos de la empresa y casos de uso. | ● Document Intelligence Studio ● API de REST ● SDK de C# ● SDK de Java ● SDK de JavaScript ● SDK de Python |
Plantilla personalizada
Nota
Para entrenar un modelo de plantilla personalizada, se debe establecer la buildMode
propiedad en template
.
Para obtener más información, consulte Entrenamiento de un modelo de plantilla
Acerca de | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Modelo de plantilla personalizada | El modelo de plantilla personalizada extrae valores y campos etiquetados de documentos estructurados y semiestructurados. |
Extraer datos clave de documentos altamente estructurados con plantillas visuales definidas o diseños visuales comunes, formularios. | ● Document Intelligence Studio ● API de REST ● SDK de C# ● SDK de Python ● SDK de Java ● SDK de JavaScript |
Neuronal personalizado
Nota
Para entrenar un modelo neuronal personalizado, se debe establecer la propiedad buildMode
en neural
.
Para obtener más información, consulte Entrenamiento de un modelo neuronal
Acerca de | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Modelo neuronal personalizado | El modelo neuronal personalizado se usa para extraer datos etiquetados de documentos estructurados (encuestas, cuestionarios), semiestructurados (facturas, pedidos de compra) y no estructurados (contratos, cartas). | Extraer datos de texto, casillas y campos tabulares de documentos estructurados y no estructurados. | Document Intelligence Studio ● API de REST ● SDK de C# ● SDK de Java ● SDK de JavaScript ● SDK de Python |
Compuesto personalizado
Acerca de | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Modelos personalizados compuestos | El modelo compuesto se crea tomando una colección de modelos personalizados y asignándolos a un único modelo creado a partir de los tipos de formulario. | Resulta de utilidad cuando se entrenan varios modelos y se quieren agrupar para analizar tipos de formulario parecidos como órdenes de compra. | ● Document Intelligence Studio ● API de REST ● SDK de C# ● SDK de Java ● SDK de JavaScript ● SDK de Python |
Modelos de clasificación personalizados
Acerca de | Descripción | Casos de uso de Automation | Opciones de desarrollo |
---|---|---|---|
Modelos de clasificación compuestos | Los modelos de clasificación personalizados combinan características de diseño y lenguaje para detectar, identificar y clasificar documentos dentro de un archivo de entrada. | ● Un paquete de solicitud de préstamo que contiene el formulario de solicitud, los pagos y el extracto bancario. ● Una colección de facturas escaneadas. |
● Studio de Documento de inteligencia ● API de REST |
Documento de inteligencia de Azure AI es un servicio de Azure AI basado en la nube para que los desarrolladores creen soluciones inteligentes de procesamiento de documentos. Documento de inteligencia aplica el reconocimiento óptico de caracteres (OCR) basado en aprendizaje automático y las tecnologías de comprensión de documentos para extraer texto, tablas, estructura y pares clave-valor de los documentos. También puede etiquetar y entrenar modelos personalizados para automatizar la extracción de datos de documentos estructurados, semiestructurados y no estructurados. Para más información sobre cada modelo, consulte los artículos de conceptos:
Tipo de modelo | Nombre del modelo |
---|---|
Modelos de análisis de documentos | ● Modelo de análisis de diseño |
Modelos creados previamente | ● Modelo de factura ● Modelo de recibo ● Modelo de documento de identidad (id.) ● Modelo de tarjeta de visita |
Modelos personalizados | ● Modelo personalizado ● Modelo compuesto |
Este contenido se aplica a: v2.1 | Última versión: v4.0 (versión preliminar)
Modelos de inteligencia de documentos y opciones de desarrollo
Sugerencia
- Para obtener una experiencia mejorada y una calidad avanzada del modelo, pruebe Studio de Documento de inteligencia v3.0.
- La versión 3.0 de Studio admite cualquier modelo entrenado con datos etiquetados de la versión 2.1.
- Puede consultar la guía de migración de API para obtener información detallada sobre la migración de la versión 2.1 a la 3.0.
Nota:
El servicio de Documento de inteligencia v2.1 admite los siguientes modelos y opciones de desarrollo.
Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las referencias de API:
Seguridad y privacidad de datos
Al igual que con todos los servicios de IA, los desarrolladores que usan el servicio de Documento de inteligencia deben estar al tanto de las directivas de Microsoft sobre los datos de los clientes. Consulte la página Datos, privacidad y seguridad para Documento de inteligencia.
Pasos siguientes
Pruebe procesar sus propios formularios y documentos con Studio de Documento de inteligencia.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Pruebe a procesar sus propios formularios y documentos con la Herramienta de etiquetado de muestras de Documento de inteligencia.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Comentarios
https://aka.ms/ContentUserFeedback.
Proximamente: Ao longo de 2024, retiraremos gradualmente GitHub Issues como mecanismo de comentarios sobre o contido e substituirémolo por un novo sistema de comentarios. Para obter máis información, consulte:Enviar e ver os comentarios