¿Qué es Azure Form Recognizer?

Este artículo es aplicable a:Form Recognizer v3.0Form Recognizer v3.0. Versión anterior:Form Recognizer v2.1

Azure Form Recognizer es un servicio de Azure Applied AI Services basado en la nube para que los desarrolladores creen soluciones inteligentes de procesamiento de documentos. Form Recognizer aplica el reconocimiento óptico de caracteres (OCR) basado en aprendizaje automático y las tecnologías de comprensión de documentos para extraer texto impreso y manuscrito, tablas, estructura y pares clave-valor de los documentos. También puede etiquetar y entrenar modelos personalizados para automatizar la extracción de datos de documentos estructurados, semiestructurados y no estructurados. Para más información sobre cada modelo, consulte los artículos de conceptos:

Tipo de modelo Nombre del modelo
Modelos de análisis de documentos Modelo OCR de lectura
Modelo de documento general
Modelo de análisis de diseño
Modelos creados previamente Modelo de formulario W-2
Modelo de factura
Modelo de recibo
Modelo de documento de identidad (id.)
Modelo de tarjeta de visita
Modelos personalizados Modelo personalizado
Modelo compuesto

¿Qué característica de Form Recognizer debo usar?

Esta sección lo ayudará a decidir qué modelo compatible con Form Recognizer v3.0 debe usar para su aplicación:

Tipo de documento Datos que se extraerán Formato de documento Su mejor solución
Un documento genérico, como un contrato o una carta. Quiere extraer principalmente líneas de texto, palabras, ubicaciones y idiomas detectados. El documento está escrito o impreso en un idioma admitido. Modelo de lectura de OCR
Documento que incluye información estructural como un informe o un estudio. Además del texto, debe extraer información estructural como tablas, marcas de selección, párrafos, títulos, encabezados y subtítulos. El documento está escrito o impreso en un idioma admitido. Modelo de análisis de diseño
Un documento estructurado o semiestructurado que incluye contenido con formato de campos y valores, como una solicitud de crédito o un formulario de encuesta. Desea extraer campos y valores, incluidos los que no están cubiertos por los modelos precompilados específicos del escenario , sin tener que entrenar un modelo personalizado. El formulario o documento es un formato estandarizado que se usa habitualmente en su empresa o sector y está impreso en un idioma admitido. Modelo de documento general
Formulario W-2 de EE. UU. Desea extraer información clave como el salario y los impuestos retenidos de los formularios fiscales W2 de Estados Unidos. El documento W-2 está en inglés de Estados Unidos (en-US). Modelo W-2
Factura Desea extraer información clave como el nombre del cliente, la dirección de facturación y el importe a pagar de las facturas. El documento de la factura está escrito o impreso en un idioma admitido. Modelo de factura
Recibo Desea extraer información clave como el nombre del comerciante, la fecha de la transacción y el total de la transacción de un recibo de venta o de una página de hotel. El recibo está escrito o impreso en un idioma admitido. Modelo de recibo
Documento de identidad (id.), como un pasaporte o un permiso de conducir. Quiere extraer información clave como el nombre, el apellido y la fecha de nacimiento de los permisos de conducir estadounidenses o de los pasaportes internacionales. Su documento de identidad es un permiso de conducir estadounidense o la página biográfica de un pasaporte internacional (no un visado). Modelo de documento de identidad (id.)
Tarjeta de presentación Quiere extraer información clave como el nombre, el apellido, el nombre de la empresa, la dirección de correo electrónico y el número de teléfono de las tarjetas de visita. El documento de la tarjeta de visita está en inglés o en japonés. Modelo de tarjeta de presentación
Documentos de tipo mixto Desea extraer pares clave-valor, marcas de selección, tablas, campos de firma y regiones seleccionadas no extraídas por los modelos de documentos precompilados o generales. Tiene varios documentos con elementos estructurados, semiestructurados o no estructurados. Modelo personalizado

Sugerencia

  • Si todavía no está seguro de qué modelo usar, pruebe el modelo de documento general para extraer pares clave-valor.
  • El modelo de documento general emplea la tecnología del motor de OCR de lectura para detectar líneas de texto, palabras, ubicaciones e idiomas.
  • El documento general también extrae los mismos datos que el modelo de diseño de documentos (páginas, tablas, estilos).

Modelos de procesamiento de documentos y opciones de desarrollo

Nota:

El servicio Form Recognizer v3.0 admite los siguientes modelos de comprensión de documentos y opciones de desarrollo.

Puede usar Form Recognizer para automatizar el procesamiento de documentos en aplicaciones y flujos de trabajo, mejorar las estrategias basadas en datos y enriquecer las capacidades de búsqueda de documentos. Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las referencias de API.

Modelo Descripción Casos de uso de Automation Opciones de desarrollo
Modelo de lectura de OCR Extraiga líneas de texto, palabras, idiomas detectados y estilo manuscrito si se detecta.
  • Procesamiento del contrato.
  • Procesamiento de informes financieros o médicos.
Modelo de documento general Extracción de texto, tablas, estructura y pares clave-valor.
  • Extracción de pares clave-valor.
  • Procesamiento de formularios.
  • Recopilación y análisis de datos de encuestas.
Modelo de análisis de diseño Extraiga de los documentos y formularios texto, marcas de selección y estructuras de tablas, junto con las coordenadas de sus rectángulos de selección.

La API de diseño se ha actualizado a un modelo precompilado.
  • Indexación y recuperación de documentos por estructura.
  • Preprocesamiento anterior al análisis de OCR.
Modelo personalizado (actualizado) Extracción y análisis de datos de formularios y documentos específicos para distintos datos empresariales y casos de uso.

La API de modelos personalizados v3.0 admite la detección de firmas para modelos de plantillas personalizadas (formularios personalizados).

La API de modelos personalizados v3.0 ahora admite dos tipos de modelos:
  • Identificación y recopilación de datos, únicos de su empresa, afectados por un cambio normativo o un acontecimiento del mercado.
  • Identificación y análisis de datos únicos que antes se pasaban por alto.
Form Recognizer Studio
  • API DE REST
  • SDK DE C#
  • SDK de Python
  • SDK de Java
  • JavaScript
  • Formulario W-2 Extraiga la información reportada en cada casilla en un formulario W-2.
    • Administración automatizada de documentos fiscales.
    • Tramitación de solicitudes de préstamos hipotecarios.
    Modelo de factura Procesamiento automatizado de datos y extracción de información clave de facturas.
    • Procesamiento de cuentas por pagar.
    • Registro e informes fiscales automatizados.
    Modelo de recibo (actualizado) Procesamiento automatizado de datos y extracción de información clave de recibos de compra.

    El modelo de recibo v3.0 admite el procesamiento de recibos de hotel de una sola página.
    • Administración de gastos.
    • Análisis de datos de comportamiento del consumidor.
    • Programa de fidelidad de clientes.
    • Procesamiento de devolución de mercancías.
    • Registro e informes fiscales automatizados.
    Modelo de documento de identidad (id.) (actualizado) Procesamiento automatizado de datos y extracción de información clave de permisos de conducir de EE. UU. y pasaportes internacionales.

    La API de documentos de identificación precompilada admite la extracción de aprobaciones, restricciones y clasificación de vehículos de permisos de conducir de EE. UU.
    • Cumplimiento de las directrices de servicios financieros "Conozca a su cliente" (KYC).
    • Administración de cuentas médicas.
    • Puntos de control de identidad y puertas de enlace.
    • Registro del hotel.
    Modelo de tarjeta de presentación Procesamiento automatizado de datos y extracción de información clave de tarjetas de presentación.
    • Administración de clientes potenciales y marketing.

    Este artículo es aplicable a:Form Recognizer v2.1Form Recognizer v2.1. Versión más reciente: Form Recognizer v3.0

    Azure Form Recognizer es un servicio de Azure Applied AI Services basado en la nube para que los desarrolladores creen soluciones inteligentes de procesamiento de documentos. Form Recognizer aplica el reconocimiento óptico de caracteres (OCR) basado en aprendizaje automático y las tecnologías de comprensión de documentos para extraer texto impreso y manuscrito, tablas, estructura y pares clave-valor de los documentos. También puede etiquetar y entrenar modelos personalizados para automatizar la extracción de datos de documentos estructurados, semiestructurados y no estructurados. Para más información sobre cada modelo, consulte los artículos de conceptos:

    Tipo de modelo Nombre del modelo
    Modelos de análisis de documentos Modelo de análisis de diseño
    Modelos creados previamente Modelo de factura
    Modelo de recibo
    Modelo de documento de identidad (id.)
    Modelo de tarjeta de visita
    Modelos personalizados Modelo personalizado
    Modelo compuesto

    ¿Qué modelo de procesamiento de documentos debo usar?

    Esta sección lo ayudará a decidir qué modelo compatible con Form Recognizer v2.1 debe usar para su aplicación:

    Tipo de documento Datos que se extraerán Formato de documento Su mejor solución
    Documento que incluye información estructural como un informe o un estudio. Además del texto, debe extraer información estructural, como tablas y marcas de selección. El documento está escrito o impreso en un idioma admitido. Modelo de análisis de diseño
    Factura Desea extraer información clave como el nombre del cliente, la dirección de facturación y el importe a pagar de las facturas. El documento de la factura está escrito o impreso en un idioma admitido. Modelo de factura
    Recibo Desea extraer información clave como el nombre del comerciante, la fecha de la transacción y el total de la transacción de un recibo de venta o de una página de hotel. El recibo está escrito o impreso en un idioma admitido. Modelo de recibo
    Documento de identidad (id.), como un pasaporte o un permiso de conducir. Quiere extraer información clave como el nombre, el apellido y la fecha de nacimiento de los permisos de conducir estadounidenses o de los pasaportes internacionales. Su documento de identidad es un permiso de conducir estadounidense o la página biográfica de un pasaporte internacional (no un visado). Modelo de documentación de id.
    Tarjeta de presentación Quiere extraer información clave como el nombre, el apellido, el nombre de la empresa, la dirección de correo electrónico y el número de teléfono de las tarjetas de visita. El documento de la tarjeta de visita está en inglés o en japonés. Modelo de tarjeta de presentación
    Documentos de tipo mixto Desea extraer pares clave-valor, marcas de selección, tablas, campos de firma y regiones seleccionadas no extraídas por los modelos de documentos precompilados o generales. Tiene varios documentos con elementos estructurados, semiestructurados o no estructurados. Modelo personalizado

    Opciones de desarrollo y modelos de Form Recognizer

    Sugerencia

    • Para obtener una experiencia mejorada y una calidad avanzada del modelo, pruebe Form Recognizer Studio v3.0 .
    • La versión 3.0 de Studio admite cualquier modelo entrenado con datos etiquetados de la versión 2.1.
    • Puede consultar la guía de migración de API para obtener información detallada sobre la migración de la versión 2.1 a la 3.0.

    Nota:

    El servicio Form Recognizer v2.1 admite los siguientes modelos y opciones de desarrollo.

    Use los vínculos de la tabla para obtener más información sobre cada característica y examinar las referencias de API:

    Modelo Descripción Opciones de desarrollo
    Análisis de diseño Extracción y análisis de texto, marcas de selección, tablas, y coordenadas de rectángulo de selección de formularios y documentos.
    Modelo personalizado Extracción y análisis de datos de formularios y documentos específicos de distintos datos empresariales y casos de uso.
    Modelo de factura Procesamiento automatizado de datos y extracción de información clave de facturas.
    Modelo de recibo Procesamiento automatizado de datos y extracción de información clave de recibos de compra.
    Modelo de documento de identidad (id.) Procesamiento automatizado de datos y extracción de información clave de permisos de conducir de EE. UU. y pasaportes internacionales.
    Modelo de tarjeta de presentación Procesamiento automatizado de datos y extracción de información clave de tarjetas de presentación.

    Seguridad y privacidad de datos

    Al igual que sucede con todos los servicios de IA, los desarrolladores que usan el servicio Form Recognizer deben estar al tanto de las directivas de Microsoft sobre los datos de los clientes. Consulte la página Datos, privacidad y seguridad de Form Recognizer.

    Pasos siguientes