¿Qué modelo debo elegir?

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documentación de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-02-29-preview.
  • La versión preliminar pública 2024-02-29-preview solo está disponible en las siguientes regiones de Azure:
  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.1 (GA)marca de verificación azulv3.0 (GA)

Este contenido se aplica a:marca de verificaciónv3.1 (GA) | Versión más reciente:marca de verificación púrpurav4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.0

Este contenido se aplica a:marca de verificaciónv3.0 (GA) | Versiones más recientes:marca de verificación púrpurav4.0 (versión preliminar)marca de verificación púrpurav3.1

Documento de inteligencia de Azure AI admite una amplia variedad de modelos que le permiten agregar procesamiento inteligente de documentos a sus aplicaciones y optimizar sus flujos de trabajo. Seleccionar el modelo adecuado es esencial para garantizar el éxito de su empresa. En este artículo, se exploran los modelos de Document Intelligence disponibles y se proporcionan instrucciones sobre cómo elegir la mejor solución para sus proyectos.

Los gráficos de decisión siguientes resaltan las características de cada modelo compatible de Document Intelligence v3.0 y le ayudan a elegir el mejor modelo para satisfacer las necesidades y los requisitos de su aplicación.

Importante

Asegúrese de comprobar la página de compatibilidad de idioma para la extracción de campos y texto de idioma admitidos por característica.

Modelos de análisis de documentos entrenados previamente

Tipo de documento Ejemplo Datos que se extraerán Su mejor solución
Un documento genérico. Un contrato o una carta. Quiere extraer principalmente líneas de texto escritas o impresas, palabras, ubicaciones e idiomas detectados. Modelo de lectura de OCR
Un documento que incluye información estructural. Un informe o estudio. Además del texto escrito o impreso, debe extraer información estructural como tablas, marcas de selección, párrafos, títulos, encabezados y subtítulos. Modelo de análisis de diseño
Un documento estructurado o semiestructurado que incluye contenido con formato, como campos (claves) y valores. Un formulario o documento que es un formato estandarizado que se usa habitualmente en su negocio o sector, como una solicitud de crédito o una encuesta. Desea extraer campos y valores, incluidos los que no están cubiertos por los modelos precompilados específicos del escenario , sin tener que entrenar un modelo personalizado. **Modelo de análisis de diseño con el parámetro features=keyValuePairs de cadena de consulta opcional habilitado **

Modelos específicos del escenario entrenados previamente

Tipo de documento Datos que se extraerán Su mejor solución
Formulario fiscal W-2 de EE. UU. Quiere extraer información clave como el salario y los impuestos retenidos. Modelo W-2 fiscal de EE. UU.
Formulario de impuestos estadounidenses 1098 Desea extraer detalles de los intereses hipotecarios, como el principal, los puntos y los impuestos. Modelo de impuestos estadounidenses 1098
Formulario de impuestos estadounidenses 1098-E Quiere extraer detalles de los intereses de préstamos estudiantiles, como el prestamista y el importe de los intereses. Modelo de impuestos estadounidenses 1098-E
Formulario de impuestos estadounidenses 1098T Quiere extraer detalles de matrícula calificados, como ajustes de beca, estado de estudiante e información del prestamista. Modelo de impuestos estadounidenses 1098-T
Formulario fiscal estadounidense  1099 (y variaciones) Quiere extraer información de los formularios 1099 y sus variaciones (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Modelo fiscal estadounidense 1099
Formulario fiscal estadounidense 1040 (y variaciones) Desea extraer información de los formularios 1040 y sus variaciones (Schedule 1, Schedule 2, Schedule 3, Schedule 8812, Schedule A, Schedule B, Schedule C, Schedule D, Schedule E, Schedule EIC, Schedule F, Schedule H, Schedule J, Schedule R, Schedule SE, Schedule SENIOR). Modelo fiscal estadounidense 1040
Contrato (acuerdo legal entre partes). Quiere extraer detalles del contrato, como partes, fechas e intervalos. Modelo de contrato
Tarjeta de seguro de salud o identificación del seguro de salud. Quiere extraer información clave, como la aseguradora, la identificación de miembro, la cobertura de prescripción y el número de grupo. Modelo de tarjeta de seguro médico
Tarjeta de crédito/débito . Desea extraer tarjetas bancarias de información clave, como el número de tarjeta y el nombre del banco. Modelo de tarjeta de crédito/débito
Certificado de matrimonio. Quiere extraer información clave de los certificados de matrimonio. Modelo de certificado de matrimonio
Factura o extracto de facturación. Quiere extraer información clave, como el nombre del cliente, la dirección de facturación y el importe a pagar. Modelo de factura
Recibo, vale o recibo de hotel de una sola página. Quiere extraer información clave, como el nombre del comerciante, la fecha de la transacción y el total de la transacción. Modelo de recibo
Documento de identidad (ID) como un permiso de conducir de EE. UU. o un pasaporte internacional. Quiere extraer información clave, como el nombre, el apellido, la fecha de nacimiento, la dirección y la firma. Modelo de documento de identidad (id.)
Hipoteca estadounidense 1003. Desea extraer información clave de la solicitud de préstamo residencial uniforme. Modelo de formulario 1003
Hipoteca estadounidense 1008. Desea extraer información clave del resumen de escritura uniforme y transmisión. Modelo de formulario de 1008
Divulgación de cierre de hipotecas de EUA. Desea extraer información clave de un formulario de divulgación de cierre de hipotecas. Modelo de formulario de divulgación de cierre de hipotecas
Documentos de tipo mixto con elementos estructurados, semiestructurados o no estructurados. Desea extraer pares clave-valor, marcas de selección, tablas, campos de firma y regiones seleccionadas no extraídas por los modelos de documentos precompilados o generales. Modelo personalizado

Sugerencia

  • Si aún no está seguro de qué modelo entrenado previamente usar, pruebe el modelo de diseño con el parámetro features=keyValuePairs de cadena de consulta opcional habilitado.
  • El modelo de diseño se basa en el motor de lectura de OCR para detectar páginas, tablas, estilos, texto, líneas, palabras, ubicaciones e idiomas.

Modelos de extracción personalizados

Conjunto de entrenamiento Documentos de ejemplo Su mejor solución
Documentos estructurados, coherentes y con un diseño estático. Formularios estructurados, como cuestionarios o solicitudes. Modelo de plantilla personalizado
Documentos estructurados, semiestructurados y no estructurados. ● Estructurados → encuestas
● Semiestructurados → facturas
● No estructurados → cartas
Modelo neuronal personalizado
Colección de varios modelos entrenados con documentos de tipo similar. ● Pedidos de compra de suministros
● Pedidos de compra de equipos
● Pedidos de compra de muebles
Todos compuestos en un único modelo.
Modelo personalizado compuesto

Modelos de clasificación personalizados

Conjunto de entrenamiento Documentos de ejemplo Su mejor solución
Al menos dos tipos diferentes de documentos. Formularios, cartas o documentos Modelos de clasificación personalizados

Pasos siguientes