Modèles de documents hypothécaires Intelligence documentaire

Article
05/10/2024

Ce contenu s’applique à : v4.0 (préversion)

Les modèles hypothécaires Intelligence documentaire utilisent de puissantes capacités de reconnaissance optique de caractères (OCR) pour analyser et extraire les champs clés des documents hypothécaires. Les documents hypothécaires peuvent être de divers formats et qualité. L’API analyse les documents hypothécaires et retourne une représentation sous forme de données JSON structurées. Les modèles ne prennent actuellement en charge que les documents en langue anglaise.

Types de documents pris en charge :

Demande de prêt immobilier (formulaire 1003)
Dossier de prêt immobilier (formulaire 1008)
Formulaire d’échéancier de prêt

Options de développement

Intelligence documentaire v4.0 (2024-02-29-preview) prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité	Ressources	ID de modèle
Modèle hypothécaire	• Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript	• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure

Critères des entrées

Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

Formats de fichiers pris en charge :

Modèle	PDF	Image : JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
Lire	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Document général	✔	✔
Prédéfinie	✔	✔
Extraction personnalisée	✔	✔
Classification personnalisée	✔	✔	✔ (2024-02-29-preview)

Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).
Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
- Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.
- Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

Essayer l’extraction des données de documents hypothécaires

Pour voir comment l’extraction de données fonctionne pour le service des documents hypothécaires, vous avez besoin des ressources suivantes :

Un abonnement Azure. Vous pouvez en créer un gratuitement.
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Document Intelligence Studio

Dans la page d’accueil d’Intelligence documentaire Studio, sélectionnez hypothèque.
Vous pouvez analyser l’exemple de documents hypothécaires ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

Essayer le Studio d’Intelligence documentaire

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues : Modèles prédéfinis.

Extraction des champs du formulaire 1003 Demande de prêt immobilier

Voici les champs extraits d’un formulaire 1003 dans la réponse de sortie JSON.

Nom	Type	Description	Exemple de sortie
LenderLoanNumber	Chaîne	Numéro de prêt du prêteur ou identificateur de prêt universel	10Bx939c5543TqA1144M999143X38
AgencyCaseNumber	Chaîne	Numéro de cas de l’agence	115894
Emprunteur	Object	Objet qui contient les marqueurs d’identité de l’emprunteur, tels que le nom, le numéro de sécurité sociale (USA), la date de naissance.
Co-Borrower	Object	Objet qui contient les noms du co-emprunteur et la date signée.
CurrentEmployment	Object	Objet qui contient des informations sur l’emploi actuel, notamment le nom de l’employeur, le numéro de téléphone de l’employeur, l’adresse de l’employeur.
Prêt	Object	Objet qui contient des informations sur le prêt, notamment le montant, le type de but, le type de refinancement.
Propriété	object	Objet qui contient des informations sur la propriété, notamment : adresse, nombre d’unités, valeur.

Les paires clé-valeur et les éléments de ligne extraits du formulaire 1003 se trouvent dans la section documentResults de la sortie JSON.

Extraction des champs du formulaire 1008 Dossier de prêt immobilier

Voici les champs extraits d’un formulaire 1008 dans la réponse de sortie JSON.

Nom	Type	Description
Emprunteur	Object	Objet qui contient des informations sur l’emprunteur, notamment le nom et le nombre d’emprunteurs.
Propriété	Object	Objet qui contient des informations sur la propriété, notamment : adresse, état d’occupation, prix de vente.
Mortgage	Object	Objet qui contient des informations sur l’hypothèque, notamment : type de prêt, type d’amortissement, type de but de prêt.
Underwriting	Object	Objet qui contient des informations sur les informations de sous-écriture, notamment le nom du sous-rédacteur, le nom de l’évaluateur, le revenu de l’emprunteur.
Vendeur	Object	Objet qui contient des informations sur le vendeur, notamment le nom, l’adresse, le nombre.

Les paires clé-valeur et les éléments de ligne de formulaire 1008 extraits se trouvent dans la section documentResults de la sortie JSON.

Extraction de champs de divulgation de clôture hypothécaire

Voici les champs extraits d’un formulaire de divulgation de clôture hypothécaire dans la réponse de sortie JSON.

Nom	Type	Description
Fermeture	Object	Objet qui contient des informations sur les informations de clôture, notamment la date d’émission, la date de clôture, la date de déboursement.
Transaction	Object	Objet qui contient des informations sur les informations de transaction, notamment le nom des emprunteurs, l’adresse des emprunteurs, le nom du vendeur.
Prêt	Object	Objet qui contient des informations sur le prêt, notamment le terme, l’objectif, le produit.

Les paires clé-valeur et les éléments de ligne de la divulgation de clôture hypothécaire extraits se trouvent dans la section documentResults de la sortie JSON.

Étapes suivantes

Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.

Partage via