Partager via


Modèles personnalisés composés Intelligence documentaire

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif. Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La préversion publique des bibliothèques de client Intelligence documentaire utilise par défaut la version 2024-07-31-preview de l’API REST.
  • La préversion publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Notez que le modèle génératif personnalisé (extraction de champ de document) dans AI Studio est disponible uniquement dans la région USA Centre Nord :
    • USA Est
    • USA Ouest 2
    • Europe Ouest
    • USA Centre Nord 

Ce contenu s’applique à : coche v4.0 (préversion) | Versions précédentes : coche-bleue v3.1 (GA) coche-bleue v3.0 (GA) coche-bleue v2.1 (GA)

Ce contenu s’applique à : coche v3.1 (GA) | Dernière version : coche violette v4.0 (préversion) | Versions précédentes : coche-bleue v3.0 coche-bleue v2.1

Ce contenu s’applique à : coche v3.0 (GA) | Dernières versions : coche violette v4.0 (préversion) coche-violette v3.1 | Version précédente : coche-bleue v2.1

Ce contenu s’applique à : coche v2.1 | Dernière version : coche-bleue v4.0 (préversion)

Important

Le comportement de l’opération model compose change pour api-version=2024-07-31-preview. L’opération model compose v4.0 et versions ultérieures ajoute un classifieur formé explicitement au lieu d’un classifieur implicite pour l’analyse. Pour la version précédente du modèle composé, consultez Modèles personnalisés composés v3.1. Si vous utilisez actuellement des modèles composés, envisagez d’effectuer une mise à niveau vers la dernière implémentation.

Qu’est-ce qu’un modèle composé ?

Avec les modèles composés, vous pouvez regrouper plusieurs modèles personnalisés dans un modèle composé qui est appelé avec un ID de modèle unique. Par exemple, votre modèle composé peut inclure des modèles personnalisés qui sont entraînés pour analyser vos approvisionnements, vos équipements et vos bons de commande de mobilier. Au lieu d’essayer de sélectionner manuellement le modèle approprié, vous pouvez utiliser un modèle composé pour déterminer le modèle personnalisé approprié pour chaque analyse et extraction.

Pour certains scénarios, il est d’abord nécessaire de classer le document, puis de l’analyser avec le modèle le mieux adapté pour extraire les champs du modèle. Cela peut inclure les scénarios dans lesquels un utilisateur charge un document, mais où le type de document n’est pas explicitement connu. Cela peut également s’appliquer lorsque plusieurs documents sont analysés ensemble dans un seul fichier et que ce dernier est envoyé pour traitement. Votre application doit ensuite identifier les documents de composant et sélectionner le meilleur modèle pour chaque document.

Dans les versions précédentes, l’opération model compose a effectué une classification implicite pour déterminer le modèle personnalisé qui représente le mieux le document envoyé. L’implémentation 2024-07-31-preview de l’opération model compose remplace la classification implicite des versions antérieures par une étape de classification explicite et ajoute le routage conditionnel.

Avantages de la nouvelle opération de composition de modèles

La nouvelle opération model compose vous oblige à entraîner un classifieur explicite et offre plusieurs avantages.

  • Amélioration incrémentielle continue. Vous pouvez améliorer de façon cohérente la qualité du classifieur en ajoutant d’autres échantillons et en améliorant de façon incrémentielle la classification. Ce réglage précis garantit que vos documents sont toujours acheminés vers le modèle approprié pour l’extraction.

  • Contrôle complet du routage. En ajoutant un routage basé sur la confiance, vous fournissez un seuil de confiance pour le type de document et la réponse de classification.

  • Ignorez les types de documents spécifiques au document au cours de l’opération. Les implémentations antérieures de l’opération model compose ont sélectionné le meilleur modèle d’analyse pour l’extraction en fonction du score de confiance même si les scores de confiance les plus élevés étaient relativement faibles. En fournissant un seuil de confiance ou en ne mappant pas explicitement un type de document connu de la classification à un modèle d’extraction, vous pouvez ignorer des types de documents spécifiques.

  • Analysez plusieurs instances du même type de document. Lorsqu’elle est associée à l’option splitMode du classifieur, l’opération model compose peut détecter plusieurs instances du même document dans un fichier et fractionner ce dernier pour traiter chaque document indépendamment. Utiliser splitMode permet de traiter plusieurs instances d’un document dans une seule requête.

  • Prise en charge des fonctionnalités complémentaires. Vous pouvez également spécifier des fonctionnalités complémentaires, telles que les champs de requête ou les codes à barres, comme paramètres du modèle d’analyse.

  • Augmentation du maximum de modèles personnalisés affectés pour 500. La nouvelle implémentation de l’opération model compose vous permet d’affecter jusqu’à 500 modèles personnalisés formés à un modèle composé unique.

Comment utiliser la composition de modèle

  • Commencez par collecter des échantillons de tous les documents nécessaires, y compris des échantillons contenant des informations qui doivent être extraites ou ignorées.

  • Entraînez un classifieur en organisant les documents dans les dossiers dont les noms correspondent au type de document que vous envisagez d’utiliser dans la définition de votre modèle composé.

  • Enfin, entraînez un modèle d’extraction pour chacun des types de document que vous envisagez d’utiliser.

  • Une fois vos modèles de classification et d’extraction entraînés, utilisez Document Intelligence Studio, les bibliothèques clientes ou l’API REST pour composer les modèles de classification et d’extraction dans un modèle composé.

Utilisez le paramètre splitMode pour contrôler le comportement de fractionnement de fichier :

  • Aucun. Le fichier entier est traité comme un document unique.
  • perPage. Chaque page du fichier est traitée comme un document distinct.
  • auto. Le fichier est automatiquement divisé en documents.

Facturation et tarification

Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification dépend nombre de pages analysées par le modèle d’analyse en aval. La facturation dépend du prix de l’extraction des pages acheminées vers un modèle d’extraction. Outre la classification explicite, des frais de classification de toutes les pages du fichier d’entrée s’ajoutent. Pour plus d’informations, consultez la page Tarification d’Intelligence documentaire.

Utiliser la composition de modèles

  • Commencez par créer une liste de tous les ID de modèle que vous souhaitez composer dans un seul modèle.

  • Composez les modèles dans un seul ID de modèle à l’aide de Studio, de l’API REST ou des bibliothèques clientes.

  • Utilisez l’ID de modèle composé pour analyser les documents.

Billing

Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification dépend du nombre de pages analysées. La facturation dépend du prix de l’extraction des pages acheminées vers un modèle d’extraction. Pour plus d’informations, consultez la page Tarification d’Intelligence documentaire.

  • Les tarifs ne changent pas pour l’analyse d’un document à l’aide d’un modèle personnalisé ou d’un modèle personnalisé composé.

Fonctionnalités des modèles composés

  • Les modèles Custom template et custom neural peuvent être composés ensemble dans un seul modèle composé entre plusieurs versions d’API.

  • La réponse inclut une propriété docType pour indiquer les modèles composés utilisés pour analyser le document.

  • Pour les modèles custom template, le modèle composé peut être créé à l’aide de variantes d’un modèle personnalisé ou de différents types de formulaires. Cette opération est utile lorsque les formulaires entrants appartiennent à l’un de plusieurs modèles.

  • Pour les modèles custom neural, il est recommandé d’ajouter toutes les variantes d’un type de document dans un jeu de données d’entraînement et d’effectuer l’entraînement sur un modèle neuronal personnalisé. L’opération model compose convient plus particulièrement aux scénarios impliquant des documents de différents types qui sont envoyés à des fins d’analyse.

Limites du modèle composé

  • L’opération model compose permet d’affecter jusqu’à 500 modèles à un seul ID de modèle. Si le nombre de modèles que vous souhaitez composer dépasse la limite supérieure d’un modèle composé, vous pouvez utiliser l’une des alternatives suivantes :

  • L’analyse d’un document à l’aide de modèles composés est identique à l’analyse d’un document à l’aide d’un modèle unique. Le résultat Analyze Document retourne une propriété docType qui indique les modèles de composants que vous avez sélectionnés pour l’analyse du document.

  • Actuellement, l’opération model compose n’est disponible que pour les modèles personnalisés entraînés avec des étiquettes.

Compatibilité du modèle composé

Type de modèle personnalisé Modèles formés avec la v2.1 et la v2.0 Modèles personnalisés et neuronaux personnalisés v3.1 et v3.0 Préversion des modèles personnalisés et neuronaux v4.0 Préversion des modèles génératifs personnalisés v4.0
Modèles entraînés avec les versions 2.1 et 2.0 Non pris en charge Non pris en charge Non pris en charge Non pris en charge
Modèles personnalisés et neuronaux v3.0 et v3.1 Non pris en charge Prise en charge Prise en charge Non pris en charge
Préversion des modèles personnalisés et neuronaux v4.0 Non pris en charge Prise en charge Prise en charge Non pris en charge
Préversion des modèles génératifs personnalisés v4.0 Non pris en charge Non pris en charge Non pris en charge Non pris en charge
  • Pour composer un modèle entraîné avec une version antérieure de l'API (v2.1 ou antérieure), entraînez un modèle avec l’API v3.0 en utilisant le même jeu de données étiqueté. Cet ajout garantit que vous pouvez composer le modèle v2.1 avec d’autres modèles.

  • Avec les modèles composés, l’utilisation de la version 2.1 de l’API continue d’être prise en charge sans mise à jour nécessaire.

Options de développement

Intelligence documentaire v4.0:2024-07-31-preview prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité Ressources
Modèle personnalisé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modèle composé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.1 :2023-07-31 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources
Modèle personnalisé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modèle composé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.0 :31-08-2022 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources
Modèle personnalisé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modèle composé Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Intelligence documentaire v2.1 prend en charge les ressources suivantes :

Fonction Ressources
Modèle personnalisé ● Outil d’étiquetage Intelligence Documentaire
API REST
SDK Bibliothèque client
Intelligence Documentaire Conteneur Docker
Modèle composé Outil d’étiquetage Document Intelligence
REST API
C# SDK
Java SDK
• JavaScript SDK
Python SDK

Étapes suivantes

Apprenez à créer et à composer des modèles personnalisés :