Modèle de modèle personnalisé Intelligence documentaire
Important
- Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif. Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
- La préversion publique des bibliothèques de client Intelligence documentaire utilise par défaut la version 2024-07-31-preview de l’API REST.
- La préversion publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Notez que le modèle génératif personnalisé (extraction de champ de document) dans AI Studio est disponible uniquement dans la région USA Centre Nord :
- USA Est
- USA Ouest 2
- Europe Ouest
- USA Centre Nord
Ce contenu s’applique à : v4.0 (préversion) | Versions précédentes : v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Version précédente : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Un modèle personnalisé (anciennement formulaire personnalisé) est un modèle de document facile à entraîner qui extrait avec précision des paires clé-valeur, marques de sélection, tables, régions et signatures étiquetées à partir de documents. Les modèles utilisent des indications de disposition pour extraire des valeurs de documents et permettent d’extraire des champs de documents hautement structurés avec des modèles visuels définis.
Les modèles personnalisés partagent le même format et la même stratégie d’étiquetage que les modèles neuronaux personnalisés, avec la prise en charge d’un plus grand nombre de types de champs et de langues.
Fonctionnalités des modèles
Les modèles personnalisés prennent en charge les paires clé-valeur, les marques de sélection, les tables, les champs de signature et certaines régions.
Champs de formulaire | Marques de sélection | Champs tabulaires (tables) | Signature | Zones concernées | Champs qui se chevauchent |
---|---|---|---|---|---|
Prise en charge | Prise en charge | Prise en charge | Prise en charge | Prise en charge | Non pris en charge |
Champs tabulaires
Avec la mise en production des versions v3.0 et ultérieures de l’API, les modèles personnalisés ajoutent la prise en charge des champs tabulaires sur plusieurs pages (tables) :
- Pour étiqueter une table qui s’étend sur plusieurs pages, étiquetez chaque ligne de la table sur les différentes pages d’une seule table.
- En guise de bonne pratique, assurez-vous que votre jeu de données contient quelques exemples des variations attendues. Par exemple, incluez des exemples dans lesquels la table entière se trouve sur une seule page et où les tables s’étendent sur deux pages ou plus si vous prévoyez de voir ces variations dans les documents.
Les champs tabulaires sont également utiles lors de l’extraction d’informations répétées dans un document qui n’est pas reconnu comme une table. Par exemple, une section répétée d’expériences de travail dans un CV peut être étiquetée et extraite en tant que champ tabulaire.
Gestion des variations
Les modèles s’appuient sur un modèle visuel défini et les modifications apportées aux résultats du modèle entraînent une moindre précision. Dans ces cas, fractionnez votre jeu de données d’entraînement pour inclure au moins cinq échantillons de chaque modèle et entraînez un modèle pour chacune des variations. Vous pouvez ensuite composer les modèles en un seul point de terminaison. Pour les modifications subtiles, comme les images et les documents PDF numériques, il est préférable d’inclure au moins cinq exemples de chaque type dans le même jeu de données d’entraînement.
Critères des entrées
Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.
Formats de fichiers pris en charge :
Modèle PDF Image :
JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office :
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTMLLire ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview ou version ultérieure) Document général ✔ ✔ Prédéfinie ✔ ✔ Custom ✔ ✔ ✱ Les fichiers Microsoft Office ne sont actuellement pas pris en charge pour d’autres modèles ou versions.
Pour PDF et TIFF, il est possible de traiter jusqu’à 2000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à un texte d'environ
8
-point à 150 points par pouce (DPI
).Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.
Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est
1GB
, avec un maximum à 10 000 pages.
Training a model
Les modèles personnalisés sont en disponibilité générale à compter de l’API v2.0 et versions ultérieures. Si vous démarrez un nouveau projet ou disposez d’un jeu de données étiqueté existant, utilisez l’API v3.1 ou v3.0 avec le Studio Intelligence documentaire pour effectuer l’apprentissage d’un modèle de modèle personnalisé.
Modèle | API REST | Kit SDK | Étiquetage et test des modèles |
---|---|---|---|
Modèle personnalisé | v3.1 API | Kit de développement logiciel (SDK) Document Intelligence | Document Intelligence Studio |
Avec l’API v3.0 et les versions ultérieures, l’opération de build pour effectuer l'apprentissage du modèle prend en charge une nouvelle propriété buildMode
. Pour l’entraînement d’un modèle personnalisé, affectez la valeur buildMode
à template
.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Les modèles personnalisés sont généralement disponibles avec l’API v3.1. Si vous démarrez un nouveau projet ou disposez d’un jeu de données étiqueté existant, utilisez l’API v3.1 ou v3.0 avec le Studio Intelligence documentaire pour effectuer l’apprentissage d’un modèle de modèle personnalisé.
Modèle | API REST | Kit SDK | Étiquetage et test des modèles |
---|---|---|---|
Modèle personnalisé | v3.1 API | Kit de développement logiciel (SDK) Document Intelligence | Document Intelligence Studio |
Avec l’API v3.0 et les versions ultérieures, l’opération de build pour effectuer l'apprentissage du modèle prend en charge une nouvelle propriété buildMode
. Pour l’entraînement d’un modèle personnalisé, affectez la valeur buildMode
à template
.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Langues et régions prises en charge
Consultez notre pagemodèles personnalisés - Language Support pour obtenir la liste complète des langages pris en charge.
Les modèles de modèles personnalisés sont généralement disponibles avec l’API v2.1.
Modèle | API REST | Kit SDK | Étiquetage et test des modèles |
---|---|---|---|
Modèle personnalisé (modèle) | Intelligence documentaire 2.1 | Kit de développement logiciel (SDK) Intelligence documentaire | Exemple d’outil d’étiquetage Intelligence documentaire |
Étapes suivantes
Apprenez à créer et à composer des modèles personnalisés :