Modelo de factura de Documento de inteligencia
Importante
- Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo. Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
- La versión preliminar pública de las bibliotecas cliente de Documento de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-07-31-preview.
- La versión preliminar pública 2024-07-31-preview solo está disponible en las siguientes regiones de Azure. Tenga en cuenta que el modelo generativo personalizado (extracción de campos del documento) en AI Studio solo está disponible en la región Centro-norte de EE. UU.:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
- Centro-Norte de EE. UU
Este contenido se aplica a: v4.0 (versión preliminar) | Versiones anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este contenido se aplica a: v3.1 (GA) | Última versión: v4.0 (versión preliminar) | Versiones anteriores: v3.0 v2.1
Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (versión preliminar) v3.1 | Versión anterior: v2.1
Este contenido se aplica a: v2.1 | Versión más reciente: v4.0 (versión preliminar)
El modelo de facturación de Documento de inteligencia usa potentes funciones de reconocimiento óptico de caracteres (OCR) para analizar y extraer campos clave y partidas de facturas de ventas, facturas de servicios públicos y pedidos de compra. Las facturas pueden ser de distintos formatos y tener diferentes grados de calidad, lo que incluye imágenes capturadas por un teléfono, documentos digitalizados y archivos PDF digitales. La API analiza el texto de las facturas; extrae información clave, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe a pagar; y devuelve una representación de datos JSON estructurada. Actualmente, el modelo admite facturas en 27 idiomas.
Tipos de documento admitidos:
- Facturas
- Facturas de servicios públicos
- Pedidos de venta
- Pedidos de compra
Procesamiento automatizado de facturas
El procesamiento automatizado de facturas es el proceso de extraer los campos clave accounts payable
de los documentos de la cuenta de facturación. Los datos extraídos incluyen las partidas de facturas integradas con los flujos de trabajo de cuentas a pagar (AP) para revisiones y pagos. Históricamente, el proceso de cuentas por pagar se realizaba de forma manual y, por tanto, llevaba mucho tiempo. La extracción precisa de los datos clave de las facturas suele ser la primera y uno de los pasos más críticos del proceso de automatización de facturas.
Recibo de muestra procesado con Documento de inteligencia de Studio:
Factura de muestra procesada con la herramienta de etiquetado de muestra de Documento de inteligencia:
Opciones de desarrollo
Documento de inteligencia v4.0 (2024-07-31-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos | Id. de modelo |
---|---|---|
Modelo de factura | • Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript |
prebuilt-invoice |
Documento de inteligencia v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos | Id. de modelo |
---|---|---|
Modelo de factura | • Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript |
prebuilt-invoice |
Documento de inteligencia v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos | Id. de modelo |
---|---|---|
Modelo de factura | • Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript |
prebuilt-invoice |
Documento de inteligencia v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos |
---|---|
Modelo de factura | ● Herramienta de etiquetado de Documento de inteligencia ● API REST ● SDK de biblioteca cliente ● Contenedor Docker de Documento de inteligencia |
Requisitos de entrada
Formatos de archivos admitidos:
Modelo PDF Imagen: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLeer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento general ✔ ✔ Creada previamente ✔ ✔ Extracción personalizada ✔ ✔ Clasificación personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).
El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de
4
MB para el nivel gratuito (F0).Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a
8
puntos de texto a 150 puntos por pulgada (PPP).Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.
Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y
1
GB para el modelo neuronal.Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es de
1
GB con un máximo de 10 000 páginas. Para 2024-07-31-preview y versiones posteriores, el tamaño total de los datos de entrenamiento se2
GB con un máximo de 10 000 páginas.
- Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
- PDF y TIFF admitidos; se procesan 2,000 páginas como máximo. En el caso de los suscriptores del nivel Gratis, solo se procesan las dos primeras páginas.
- El tamaño de archivo admitido debe ser inferior a 50 MB; y sus dimensiones, de al menos 50x50 píxeles y, como máximo, de 10 000x10 000 píxeles.
Extracción de datos del modelo de factura
Vea cómo se extraen los datos, incluida la información del cliente, los detalles del proveedor y los elementos de línea, de las facturas. Tendrá que supervisar los recursos siguientes:
Una suscripción a Azure: puede crear una cuenta gratuita.
Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (
F0
) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.
En la página principal de Estudio de Documento de inteligencia, seleccione Facturas.
Puede analizar la factura de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :
Herramienta de etiquetado de ejemplo de Documento de inteligencia
En la página principal de la herramienta de ejemplo, seleccione el icono Use prebuilt model to get data (Usar un modelo precompilado para obtener datos).
Seleccione el Tipo de formulario que quiere analizar en el menú desplegable.
Elija una dirección URL para el archivo que quiere analizar entre las opciones siguientes:
En el campo Origen, seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar.
En el campo Punto de conexión de Documento de inteligencia, pegue el punto de conexión que obtuvo con la suscripción de Documento de inteligencia.
En el campo Clave, pegue la clave que obtuvo del recurso de Documento de inteligencia.
Seleccione Run analysis (Ejecutar análisis). La herramienta de etiquetado de ejemplo de Documento de inteligencia llama a la API Analyze Prebuilt y analiza el documento.
Vea los resultados: consulte los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.
Nota
La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio de Documento de inteligencia.
Idiomas y configuraciones regionales compatibles
Para obtener una lista completa de los idiomas admitidos, consulte nuestra página compatibilidad con lenguajes de modelos precompilados.
Extracción de campos
Para ver los campos de extracción de documentos admitidos, consulte la página esquema del modelo de factura en nuestro repositorio de ejemplo de GitHub.
Los pares de clave/valor y los elementos de línea de la factura extraídos se encuentran en la sección
documentResults
de la salida JSON.
Pares clave-valor
La factura compilada previamente 2022-06-30 y versiones posteriores admiten la devolución opcional de pares clave-valor. De manera predeterminada, la devolución de pares clave-valor está deshabilitada. Los pares clave-valor son intervalos específicos dentro de la factura que identifican una etiqueta o clave, y su respuesta o valor asociados. En una factura, estos pares podrían ser la etiqueta y el valor que ha escrito el usuario para ese campo o número de teléfono. El modelo de IA está entrenado para extraer claves y valores identificables basados en una amplia variedad de tipos de documentos, formatos y estructuras.
Las claves también pueden existir de forma aislada cuando el modelo detecta que existe una clave, sin ningún valor asociado, o cuando se procesan campos opcionales. Por ejemplo, un campo de segundo nombre se puede dejar en blanco en un formulario en algunos casos. Los pares clave-valor siempre son intervalos de texto contenido en el documento. Para documentos donde el mismo valor se describe de diferentes maneras, por ejemplo, cliente/usuario, la clave asociada es cliente o usuario (según el contexto).
Campos extraídos
El servicio Factura extrae el texto, las tablas y 26 campos de la factura. A continuación se muestran los campos extraídos de una factura en la respuesta de salida JSON (la siguiente salida usa esta factura de ejemplo).
Nombre | Escribir | Descripción | Texto | Valor (salida estándar) |
---|---|---|---|---|
CustomerName | string | Cliente al que se va a facturar | Microsoft Corp | |
CustomerId | string | Identificador de referencia del cliente | CID-12345 | |
PurchaseOrder | string | Número de referencia del pedido | PO-3333 | |
InvoiceId | string | Identificador de esta factura concreta (a menudo "Número de factura") | INV-100 | |
FechaFactura | date | Fecha en que se generó la factura | 15/11/2019 | 15-11-2019 |
DueDate | date | Fecha de vencimiento de esta factura | 15/12/2019 | 15-12-2019 |
VendorName | cadena | Proveedor que ha creado la factura | CONTOSO | |
VendorAddress | string | Dirección de correo del proveedor | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | string | Nombre asociado a VendorAddress | Oficina central de Contoso | |
CustomerAddress | string | Dirección de correo del cliente | 123 Other Street, Redmond, Washington, 98052 | |
CustomerAddressRecipient | string | Nombre asociado a CustomerAddress | Microsoft Corp | |
BillingAddress | string | Dirección facturación del cliente | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | string | Nombre asociado a BillingAddress | Servicios Microsoft | |
ShippingAddress | string | Dirección de envío explícita del cliente | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | string | Nombre asociado a ShippingAddress | Microsoft Delivery | |
Subtotal | number | Campo de subtotal identificado en esta factura | 100,00 USD | 100 |
TotalTax | number | Campo de total de impuestos identificado en esta factura | 10,00 USD | 10 |
InvoiceTotal | number | Total de cargos nuevos asociados a esta factura | 110,00 USD | 110 |
AmountDue | number | Importe total debido al proveedor | 610,00 USD | 610 |
ServiceAddress | string | Dirección de servicio o dirección de propiedad explícitas para el cliente | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | string | Nombre asociado a ServiceAddress | Servicios Microsoft | |
RemittanceAddress | string | Dirección de remite o de pago explícitas del cliente | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | string | Nombre asociado a RemittanceAddress | Facturación de Contoso | |
ServiceStartDate | date | Primera fecha del período de servicio (por ejemplo, un período de servicio de factura de la utilidad) | 14/10/2019 | 2019-10-14 |
ServiceEndDate | date | Fecha de finalización del período de servicio (por ejemplo, un período de servicio de factura de la utilidad) | 14/11/2019 | 14-11-2019 |
PreviousUnpaidBalance | number | Saldo explícito no pagado previamente | 500,00 USD | 500 |
A continuación, se muestran los elementos de línea extraídos de una factura en la respuesta de salida JSON y usa esta factura de ejemplo:
Nombre | Escribir | Descripción | Texto (elemento de línea n.º 1) | Valor (salida estándar) |
---|---|---|---|---|
Elementos | string | Línea de texto de cadena completa del elemento de línea | 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00 | |
Amount | number | La cantidad del elemento de línea | $60.00 | 100 |
Descripción | string | La descripción de texto para el elemento de la línea de factura | Servicios de consultoría | Servicios de consultoría |
Cantidad | number | La cantidad para este elemento de línea de factura | 2 | 2 |
UnitPrice | number | El precio neto o bruto (según la configuración de factura bruta de la factura) de una unidad de este elemento | $30.00 | 30 |
ProductCode | string | Código de producto, número de producto o SKU asociado al elemento de línea específico | A123 | |
Unidad | string | Unidad del elemento de línea, por ejemplo, kg, lb, etc. | horas | |
Fecha | fecha | Fecha correspondiente a cada elemento de línea. Suele ser la fecha en la que se ha enviado la partida presupuestaria. | 3/4/2021 | 2021-03-04 |
Impuesto | number | Impuestos asociados a cada elemento de línea. Los valores posibles incluyen importe de impuestos, porcentaje de impuestos e impuesto S/N | 10% |
A continuación se muestran campos complejos extraídos de una factura en la respuesta de salida JSON:
TaxDetails
Los detalles fiscales definen impuestos específicos aplicados al total de la factura.
Nombre | Escribir | Descripción | Texto (elemento de línea n.º 1) | Valor (salida estándar) |
---|---|---|---|---|
Elementos | string | Línea de texto de cadena completa del elemento fiscal | V.A.T. 15% $60,00 | |
Importe | number | La cantidad fiscal del artículo fiscal | 60,00 | 60 |
Tipo | string | Tasa fiscal del artículo fiscal | 15 % |
PaymentDetails
Enumere todas las opciones detectadas de pago detectadas en el campo.
Nombre | Escribir | Descripción | Texto (elemento de línea n.º 1) | Valor (salida estándar) |
---|---|---|---|---|
IBAN |
string | Número de cuenta bancaria interna | GB33BUKB20201555555555 | |
SWIFT |
string | Código SWIFT | BUKBGB22 | |
BankAccountNumber | string | Número de cuenta bancaria, un identificador único para una cuenta bancaria | 123456 | |
BPayBillerCode | string | Código de facturador de B-Pay australiano | 12345 | |
BPayReference | string | Código de referencia de B-Pay australiano | 98765432100 |
Salida de JSON
La salida JSON tiene tres partes:
- El nodo
"readResults"
contiene todo el texto reconocido y las marcas de selección. El texto se organiza por página, después por líneas y luego por palabras individuales. - El nodo
"pageResults"
contiene las tablas y celdas extraídas con sus rectángulos delimitadores, su confianza y una referencia a las líneas y palabras en readResults. - El nodo
"documentResults"
contiene los valores específicos y los elementos de línea de la factura que el modelo ha detectado. Es donde encontrar todos los campos de la factura, como ID de factura, enviar a, facturar a, cliente, total, elementos de línea y mucho más.
Guía de migración
- Siga la Guía de migración de Document Intelligence v3.1 para obtener información sobre cómo usar la versión v3.0 en las aplicaciones y flujos de trabajo.
Pasos siguientes
Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Pruebe a procesar sus propios formularios y documentos con la Herramienta de etiquetado de muestras de Documento de inteligencia.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.