Share via


Modelos de documentos de hipotecas de Documento de inteligencia

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar)marca de verificación

El modelo de hipotecas de Documento de inteligencia usa eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) y modelos de aprendizaje profundo para analizar y extraer campos clave de documentos de hipotecas. Los documentos de hipotecas pueden ser de varios formatos y calidad. La API analiza documentos de hipotecas, extrae información clave y devuelve una representación de datos JSON estructurados. Actualmente, los modelos solo admiten documentos en inglés.

Tipos de documento admitidos:

  • Solicitud uniforme de préstamo residencial (formulario 1003)
  • Resumen uniforme de suscripción y transmisión (formulario 1008)
  • Formulario de declaración de cierre

Opciones de desarrollo

Documento de inteligencia v4.0 (2024-02-29-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de hipotecas Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Leer
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento general
    Creada previamente
    Extracción personalizada
    Clasificación personalizada ✔ (2024-02-29-preview)
  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones de entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a un 8 texto de 150 puntos a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

    • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 G-MB para el modelo neuronal.

    • Para el modelo de entrenamiento de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

Probar la extracción de datos de documentos de hipotecas

Para ver cómo funciona la extracción de datos para el servicio de documentos de hipotecas, necesita los siguientes recursos:

  • Una suscripción a Azure (se puede crear de forma gratuita).

  • Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Estudio del documento de inteligencia

  1. En la página principal de Document Intelligence Studio, seleccione hipoteca.

  2. Puede analizar un documento de hipoteca de ejemplo o cargar sus propios archivos.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

    Captura de pantalla de los botones Ejecutar análisis y Analizar opciones en Document Intelligence Studio.

Idiomas y configuraciones regionales compatibles

Vea nuestra página de Compatibilidad de idiomas: modelos precompilados para obtener una lista completa de los idiomas admitidos.

Extracción de campos 1003 Solicitud uniforme de préstamo residencial (URLA)

A continuación se muestran los campos extraídos de un formulario de URLA 1003 en la respuesta de salida JSON.

Nombre Escribir Descripción Salida de ejemplo
LenderLoanNumber Cadena Número de préstamo de prestamista o identificador de préstamo universal 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber Cadena Número de caso de agencia 115894
Prestatario Object Objeto que contiene los marcadores de identidad del prestatario, como nombre, número del seguro social y fecha de nacimiento.
Coprestatario Object Objeto que contiene el nombre del coprestatario y la fecha firmada.
CurrentEmployment Object Objeto que contiene información sobre el empleo actual y que incluye el nombre de la empresa, número de teléfono de la empresa y dirección de la empresa.
Préstamo Object Objeto que contiene información sobre el préstamo y que incluye el importe, tipo de finalidad y tipo de refinanciación.
Propiedad objeto Objeto que contiene información sobre la propiedad y que incluye la dirección, número de viviendas y valor.

Los pares clave-valor y los elementos de línea extraídos del URLA 1003 se encuentran en la sección documentResults de la salida JSON.

Extracción de campos 1008 Resumen uniforme de suscripción y transmisión

A continuación se muestran los campos extraídos de un formulario 1008 en la respuesta de salida JSON.

Nombre Escribir Descripción Salida de ejemplo
Prestatario Object Objeto que contiene información sobre el prestatario y que incluye el nombre y número de prestatarios.
Propiedad Object Objeto que contiene información sobre la propiedad y que incluye la dirección, estado de ocupación y precio de venta.
Hipoteca Object Objeto que contiene información sobre la hipoteca y que incluye el tipo de préstamo, tipo de amortización y tipo de finalidad del préstamo.
Seguro Object Objeto que contiene la información sobre el seguro y que incluye el nombre de la aseguradora, nombre del evaluador e ingresos del prestatario.
Vendedor Object Objeto que contiene información sobre el vendedor y que incluye el nombre, dirección y número.

Los pares clave/valor y los elementos de línea extraídos del formulario 1008 se encuentran en la sección documentResults de la salida JSON.

Extracción de campos de declaraciones de cierre de hipotecas

A continuación se muestran los campos extraídos de un formulario de declaración de cierre de hipoteca en la respuesta de salida JSON.

Nombre Escribir Descripción Salida de ejemplo
Cierre Object Objeto que contiene información sobre el cierre y que incluye la fecha de emisión, fecha de cierre y fecha de desembolso.
Transacción Object Objeto que contiene información sobre la transacción y que incluye el nombre del prestatario, dirección del prestatario y el nombre del vendedor.
Préstamo Object Objeto que contiene información sobre el préstamo y que incluye el término, finalidad y producto.

Los pares clave/valor y los elementos de línea extraídos de la declaración de cierre de hipoteca se encuentran en la sección documentResults de la salida JSON.

Pasos siguientes