Modelo de recibo de Documento de inteligencia

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documentación de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-02-29-preview.
  • La versión preliminar pública 2024-02-29-preview solo está disponible en las siguientes regiones de Azure:
  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.1 (GA)marca de verificación azulv3.0 (GA)marca de verificación azulv2.1 (GA)

Este contenido se aplica a:marca de verificaciónv3.1 (GA) | Versión más reciente:marca de verificación púrpurav4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.0marca de verificación azulv2.1

Este contenido se aplica a:marca de verificaciónv3.0 (GA) | Versiones más recientes:marca de verificación púrpurav4.0 (versión preliminar)marca de verificación púrpurav3.1 | Versión anterior:marca de verificación azulv2.1

Este contenido se aplica a:marca de verificaciónv2.1 | Versión más reciente:marca de verificación azulv4.0 (versión preliminar)

El modelo de recibo de Documento de inteligencia combina funcionalidades de reconocimiento óptico de caracteres (OCR) eficaces con modelos de aprendizaje profundo para analizar y extraer información clave de recibos de ventas. Los recibos pueden tener varios formatos y calidad, incluidos los recibos impresos y manuscritos. La API extrae información clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de la transacción, y devuelve datos JSON estructurados.

Tipos de recibo admitidos:

  • Térmico
  • Tarjeta de crédito
  • Gas
  • Parking
  • Hotel
  • Transporte
  • Comunicación
  • Entretenimiento
  • Vuelo
  • Cursos
  • Farmacia/Medicina

Extracción de datos de recibo

La digitalización de recibos abarca la transformación de varios tipos de recibos, incluidos los escaneados, los fotografías y las copias impresas, en un formato digital para un procesamiento descendente simplificado. Algunos ejemplos son la administración de gastos, el análisis del comportamiento del consumidor, la automatización fiscal, etc. El uso de Documento de inteligencia con tecnología OCR (reconocimiento óptico de caracteres) puede extraer e interpretar datos de estos diversos formatos de recibo. El procesamiento de Documento de inteligencia simplifica el proceso de conversión, pero también reduce significativamente el tiempo y el esfuerzo necesarios, lo que facilita la administración y recuperación eficientes de datos.

Recibo de ejemplo procesado con Documento de inteligencia Studio:

Captura de pantalla de un recibo de ejemplo procesado en Documento de inteligencia Studio.

Opciones de desarrollo

Documento de inteligencia v4.0 (2024-02-29-preview, 2023-10-31-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
Recibo precompilado

Documento de inteligencia v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
Recibo precompilado

Documento de inteligencia v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
Recibo precompilado

Documento de inteligencia v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo de recibo Herramienta de etiquetado de Documento de inteligencia
API REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Leer
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento general
    Creada previamente
    Extracción personalizada
    Clasificación personalizada ✔ (2024-02-29-preview)
  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones de entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a un 8 texto de 150 puntos a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

    • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 G-MB para el modelo neuronal.

    • Para el modelo de entrenamiento de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

  • Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
  • Se admite la asignación de páginas para PDF y TIFF: Documento de inteligencia puede procesar hasta 2000 páginas para suscriptores de nivel Estándar o solo las dos primeras páginas para suscriptores de nivel Gratis.
  • Tamaño de archivo admitido: menos de 50 MB; píxeles mínimos: 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de recibo

Vea cómo Documento de inteligencia extrae de los recibos los datos, incluida la hora y la fecha de las transacciones, la información del comerciante y los importes totales. Tendrá que supervisar los recursos siguientes:

  • Una suscripción a Azure: puede crear una cuenta gratuita.

  • Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Nota:

Documento de inteligencia Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

  1. En la página principal de Documento de inteligencia de Studio, seleccione Recibos.

  2. Puede analizar el recibo de ejemplo o cargar archivos propios.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

    Captura de pantalla de los botones Ejecutar análisis y Analizar opciones en Document Intelligence Studio.

Herramienta de etiquetado de ejemplo de Documento de inteligencia

  1. Vaya a Herramienta de ejemplo de Documento de inteligencia.

  2. En la página principal de la herramienta de ejemplo, seleccione el icono Use prebuilt model to get data (Usar un modelo precompilado para obtener datos).

    Captura de pantalla del proceso de análisis de resultados del modelo de diseño.

  3. Seleccione el Tipo de formulario que quiere analizar en el menú desplegable.

  4. Elija una dirección URL para el archivo que quiere analizar entre las opciones siguientes:

  5. En el campo Origen, seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar.

    Captura de pantalla del menú desplegable de ubicación del origen.

  6. En el campo Punto de conexión de Documento de inteligencia, pegue el punto de conexión que obtuvo con la suscripción de Documento de inteligencia.

  7. En el campo Clave, pegue la clave que obtuvo del recurso de Documento de inteligencia.

    Captura de pantalla del menú desplegable Seleccionar tipo de formulario.

  8. Seleccione Run analysis (Ejecutar análisis). La herramienta de etiquetado de ejemplo de Documento de inteligencia llama a la API Analyze Prebuilt y analiza el documento.

  9. Vea los resultados: consulte los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

    Captura de pantalla de la operación de análisis de resultados del modelo de diseño.

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio de Documento de inteligencia.

Idiomas y configuraciones regionales compatibles

Vea nuestra página de Compatibilidad de idiomas: modelos precompilados para obtener una lista completa de los idiomas admitidos.

Extracción de campos

Nombre Escribir Descripción Salida estandarizada
ReceiptType String Tipo de recibo de venta Detallados
MerchantName String Nombre del comerciante que emite el recibo
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante +1 xxx xxx xxxx
MerchantAddress String Dirección mostrada del comerciante
Fecha de transacción Fecha Fecha de emisión del recibo aaaa-mm-dd
TransactionTime Time Hora de emisión del recibo hh-mm-ss (24 horas)
Total Número (USD) Número total de transacciones de recibos Float de dos decimales
Subtotal Número (USD) Subtotal del recibo, a menudo antes de aplicar impuestos Float de dos decimales
Impuesto Número (USD) Total de impuestos en el recibo (impuesto sobre ventas o equivalente). Se ha cambiado el nombre a "TotalTax" en la versión 2022-06-30. Float de dos decimales
Sugerencia Número (USD) Propina incluida por el comprador Float de dos decimales
Elementos Matriz de objetos Líneas del artículo extraídas, con el nombre, la cantidad, el precio por unidad y el precio total extraídos
Nombre String Descripción del artículo. Se ha cambiado el nombre a "Description" en la versión 2022-06-30.
Cantidad Number Cantidad de cada artículo Float de dos decimales
Precio Número Precio individual de cada unidad del artículo Float de dos decimales
TotalPrice Número Precio total del artículo Float de dos decimales

Documento de inteligencia v3.0 y versiones posteriores presentan varias características y funcionalidades nuevas. Además de los recibos térmicos, el modelo de recibos admite el procesamiento de recibos de hotel de una página y la extracción de detalles fiscales para todos los tipos de recibos.

En Documento de inteligencia v4.0 y versiones posteriores se presenta la compatibilidad con la moneda de todos los campos relacionados con el precio para los recibos térmicos y de hoteles.

Recibo

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-3210
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
TransactionDate date Fecha de emisión del recibo 06 de junio de 2019
TransactionTime time Hora de emisión del recibo 4:49 pm
Subtotal number Subtotal del recibo, a menudo antes de aplicar impuestos $12.34
TotalTax number Impuesto sobre el recibo; impuesto sobre ventas o equivalente $2.00
Tip number Propina incluida por el comprador $1.00
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Surface Pro 6
Items.*.Quantity number Cantidad de cada artículo 1
Items.*.Price number Precio individual de cada unidad del artículo $999.00
Items.*.ProductCode string Código de producto, número de producto o SKU asociado al elemento de línea específico A123
Items.*.QuantityUnit string Unidad de cantidad de cada artículo
TaxDetails array
TaxDetails.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Importe de los detalles fiscales $999.00

receipt.retailMeal

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-3210
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
TransactionDate date Fecha de emisión del recibo 06 de junio de 2019
TransactionTime time Hora de emisión del recibo 4:49 pm
Subtotal number Subtotal del recibo, a menudo antes de aplicar impuestos $12.34
TotalTax number Impuesto sobre el recibo; impuesto sobre ventas o equivalente $2.00
Tip number Propina incluida por el comprador $1.00
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Surface Pro 6
Items.*.Quantity number Cantidad de cada artículo 1
Items.*.Price number Precio individual de cada unidad del artículo $999.00
Items.*.ProductCode string Código de producto, número de producto o SKU asociado al elemento de línea específico A123
Items.*.QuantityUnit string Unidad de cantidad de cada artículo
TaxDetails array
TaxDetails.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Importe de los detalles fiscales $999.00

receipt.creditCard

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-3210
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
TransactionDate date Fecha de emisión del recibo 06 de junio de 2019
TransactionTime time Hora de emisión del recibo 4:49 pm
Subtotal number Subtotal del recibo, a menudo antes de aplicar impuestos $12.34
TotalTax number Impuesto sobre el recibo; impuesto sobre ventas o equivalente $2.00
Tip number Propina incluida por el comprador $1.00
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Surface Pro 6
Items.*.Quantity number Cantidad de cada artículo 1
Items.*.Price number Precio individual de cada unidad del artículo $999.00
Items.*.ProductCode string Código de producto, número de producto o SKU asociado al elemento de línea específico A123
Items.*.QuantityUnit string Unidad de cantidad de cada artículo
TaxDetails array
TaxDetails.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Importe de los detalles fiscales $999.00

receipt.gas

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-3210
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
TransactionDate date Fecha de emisión del recibo 06 de junio de 2019
TransactionTime time Hora de emisión del recibo 4:49 pm
Subtotal number Subtotal del recibo, a menudo antes de aplicar impuestos $12.34
TotalTax number Impuesto sobre el recibo; impuesto sobre ventas o equivalente $2.00
Tip number Propina incluida por el comprador $1.00
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Surface Pro 6
Items.*.Quantity number Cantidad de cada artículo 1
Items.*.Price number Precio individual de cada unidad del artículo $999.00
Items.*.ProductCode string Código de producto, número de producto o SKU asociado al elemento de línea específico A123
Items.*.QuantityUnit string Unidad de cantidad de cada artículo
TaxDetails array
TaxDetails.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Importe de los detalles fiscales $999.00

receipt.parking

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-3210
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
TransactionDate date Fecha de emisión del recibo 06 de junio de 2019
TransactionTime time Hora de emisión del recibo 4:49 pm
Subtotal number Subtotal del recibo, a menudo antes de aplicar impuestos $12.34
TotalTax number Impuesto sobre el recibo; impuesto sobre ventas o equivalente $2.00
Tip number Propina incluida por el comprador $1.00
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Surface Pro 6
Items.*.Quantity number Cantidad de cada artículo 1
Items.*.Price number Precio individual de cada unidad del artículo $999.00
Items.*.ProductCode string Código de producto, número de producto o SKU asociado al elemento de línea específico A123
Items.*.QuantityUnit string Unidad de cantidad de cada artículo
TaxDetails array
TaxDetails.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Importe de los detalles fiscales $999.00

receipt.hotel

Campo Tipo Descripción Ejemplo
MerchantName string Nombre del comerciante que emite el recibo Contoso
MerchantPhoneNumber phoneNumber Número de teléfono mostrado del comerciante 987-654-310
MerchantAddress address Dirección mostrada del comerciante 123 Main St. Redmond, Washington 98052
Total number Número total de transacciones de recibos $14.34
ArrivalDate date Fecha de llegada 27Mar21
DepartureDate date Fecha de salida 28Mar21
Currency string Unidad de moneda de importes de recibo (ISO 4217) o "MIXED" si se encuentran varios valores USD
MerchantAliases array
MerchantAliases.* string Nombre alternativo del comerciante Contoso (R)
Items array
Items.* object Elemento de línea extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Precio total del artículo $999.00
Items.*.Description string Descripción del artículo Cargo de habitación
Items.*.Date date Fecha del artículo 27Mar21
Items.*.Category string Categoría del elemento Sala

Guía de migración y API de REST v3.1

Pasos siguientes