Modelo de extracto bancario de Document Intelligence
El modelo de extracto bancario de Document Intelligence combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer datos de los extractos bancarios estadounidenses. La API analiza los extractos bancarios impresos; extrae información clave, como el número de cuenta, los detalles bancarios, los detalles de extractos, los detalles de transacciones y los honorarios; y devuelve una representación de datos JSON estructurada.
Característica | version | Id. de modelo |
---|---|---|
Modelo de extracto bancario | • v4.0:2024-07-31 (versión preliminar) | prebuilt-bankStatement.us |
Extracción de datos de extractos bancarios
Un extracto bancario ayuda a revisar las actividades de la cuenta durante un período especificado. Es una declaración oficial que ayuda a detectar fraudes, seguimiento de gastos, errores contables y registrar las actividades del período. Vea cómo se extraen los datos mediante el modelo prebuilt-bankStatement.us
. Tendrá que supervisar los recursos siguientes:
Una suscripción a Azure: puede crear una cuenta gratuita
Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (
F0
) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.
Estudio del documento de inteligencia
En la página principal de Document Intelligence Studio, seleccione Extractos bancarios.
Puede analizar el extracto bancario de ejemplo o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :
Requisitos de entrada
Formatos de archivos admitidos:
Modelo PDF Imagen: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLeer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento general ✔ ✔ Creada previamente ✔ ✔ Extracción personalizada ✔ ✔ Clasificación personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).
El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de
4
MB para el nivel gratuito (F0).Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a
8
puntos de texto a 150 puntos por pulgada (PPP).Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.
Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y
1
GB para el modelo neuronal.Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es de
1
GB con un máximo de 10 000 páginas. Para 2024-07-31-preview y versiones posteriores, el tamaño total de los datos de entrenamiento es2
GB con un máximo de 10 000 páginas.
Idiomas y configuraciones regionales compatibles
Consulte nuestra página de Compatibilidad de idiomas para obtener una lista completa de los idiomas admitidos.
Extracciones de campos
Campo | Tipo | Descripción | Ejemplo |
---|---|---|---|
AccountNumber |
string |
Número de cuenta en el extracto bancario | 987-654-3210 |
AccountType |
string |
Tipo de cuenta en el extracto bancario | Comprobando |
BankAddress |
address |
Dirección mostrada del banco | 123 Main St., Redmond, Washington 98052 |
BankName |
string |
Nombre enumerado del banco | Contoso Bank |
AccountHolderAddress |
address |
Dirección del titular de la cuenta | 456 Main St., Redmond, Washington 98052 |
AccountHolderName |
string |
Nombre del titular de la cuenta | JOHN DOE |
EndingBalance |
number |
Saldo final en el extracto bancario | 1488,03 USD |
BeginningBalance |
number |
Saldo inicial en el extracto bancario | 1488,03 USD |
StatementStartDate |
date |
Fecha de inicio del extracto bancario | 1 de julio de 2017 |
StatementEndDate |
date |
Fecha de finalización del extracto bancario | 31 de julio de 2017 |
TotalServiceFees |
number |
Total de honorarios de servicio | $0.00 |
Transactions |
array |
Artículo del pedido de transacción extraído | 17/07 Transferencia en línea del cheque... 6609 Transacción número 6373187418 1500,00 USD |
Transactions.* |
object |
||
Transactions.*.Date |
date |
Fecha de la transacción | 17/07 |
Transactions.*.Description |
string |
Descripción de la transacción | Transferencia en línea del cheque... 6609 Transacción número 6373187418 |
Transactions.*.CheckNumber |
string |
Número de cheque de la transacción | 6609 |
Transactions.*.DepositAmount |
number |
Cantidad depositada en la transacción | 1500,00 USD |
Transactions.*.WithdrawalAmount |
number |
Cantidad retirada en la transacción | 1500,00 USD |
Configuraciones regionales admitidas
La versión 2027-07-31-preview de prebuilt-bankStatement.us admite la configuración regional en-us.
Pasos siguientes
Pruebe procesar sus propios formularios y documentos con Studio de Documento de inteligencia
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.