Modelo de certificado de matrimonio de Documento de inteligencia
Este contenido se aplica a: v4.0 (versión preliminar)
El modelo de certificado de matrimonio de Documento de inteligencia usa eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) para analizar y extraer campos clave de certificados de matrimonio. Los certificados de matrimonio pueden ser de varios formatos y calidad, incluidas imágenes capturadas por teléfono, documentos escaneados y archivos PDF digitales. La API analiza el texto del documento; extrae información clave como nombres de cónyuge, fecha de emisión y lugar de matrimonio; y devuelve una representación de datos JSON estructurada. El modelo admite actualmente formatos de documentos en inglés.
Procesamiento automatizado de certificados de matrimonio
El procesamiento automatizado de certificados de matrimonio es el proceso de extracción de campos clave de certificados de matrimonio. Históricamente, el proceso de análisis de certificados de matrimonio se logra manualmente y, por lo tanto, muy lento. La extracción precisa de datos clave de certificados de matrimonio suele ser la primera y uno de los pasos más críticos del proceso de automatización de certificados de matrimonio.
Opciones de desarrollo
Documento de inteligencia v4.0 (2024-07-31-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:
Característica | Recursos | Id. de modelo |
---|---|---|
prebuilt-marriageCertificate.us | • Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript |
prebuilt-marriageCertificate.us |
Requisitos de entrada
Formatos de archivos admitidos:
Modelo PDF Imagen: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLeer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento general ✔ ✔ Creada previamente ✔ ✔ Extracción personalizada ✔ ✔ Clasificación personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).
El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de
4
MB para el nivel gratuito (F0).Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a
8
puntos de texto a 150 puntos por pulgada (PPP).Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.
Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y
1
GB para el modelo neuronal.Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es de
1
GB con un máximo de 10 000 páginas. Para 2024-07-31-preview y versiones posteriores, el tamaño total de los datos de entrenamiento se2
GB con un máximo de 10 000 páginas.
Probar la extracción de datos de documentos de certificado de matrimonio
Para ver cómo funciona la extracción de datos para el servicio de tarjetas de certificado de matrimonio, necesita los siguientes recursos:
Una suscripción a Azure (se puede crear de forma gratuita).
Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (
F0
) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.
Estudio del documento de inteligencia
En la página principal de Estudio de Documento de inteligencia, seleccione Certificado de matrimonio.
Puede analizar los certificados de matrimonio de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :
Idiomas y configuraciones regionales compatibles
Para obtener una lista completa de los idiomas admitidos, consulte nuestra página compatibilidad con lenguajes de modelos precompilados.
Extracción de campos
Para ver los campos de extracción de documentos admitidos, consulte la página esquema del modelo de certificado de matrimonio en nuestro repositorio de ejemplo de GitHub.
Los pares clave-valor del certificado de matrimonio y los elementos de línea extraídos se encuentran en la sección
documentResults
de la salida JSON.
Pasos siguientes
Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.