Créer un analyseur de compréhension de contenu
Conseil / Astuce
Pour plus d’informations, consultez l’onglet Texte et images !
Les solutions Content Understanding sont basées sur la création d’un analyseur ; qui est entraîné pour extraire des informations spécifiques à partir d’un type particulier de contenu basé sur un schéma que vous définissez.
Le processus général de création d’une solution Compréhension de contenu comprend les étapes suivantes :
- Créez une ressource Foundry.
- Définissez un schéma Content Understanding pour que les informations soient extraites. Pour cela, vous pouvez vous baser sur un exemple de contenu et un modèle d’analyseur.
- Générez un analyseur en fonction du schéma terminé.
- Utilisez l’analyseur pour extraire ou générer des champs à partir de nouveaux contenus.
De nombreux modèles d’analyseur sont fournis pour vous aider à développer rapidement un analyseur adapté à vos besoins. De plus, grâce aux capacités d’IA générative de Compréhension de contenu, vous pouvez utiliser des données d’entraînement minimales pour définir un schéma par exemple. Dans de nombreux cas, le service identifie de manière précise et automatique les valeurs de données dans l’exemple de contenu qui sont mappées aux éléments de schéma. Toutefois, vous pouvez également étiqueter explicitement des champs dans du contenu comme des documents pour améliorer le niveau de performance de votre analyseur.
Création d’un analyseur avec Content Understanding Studio
Bien que vous puissiez développer une solution Content Understanding complète via l’API ou un KIT de développement logiciel (SDK) spécifique à un langage, Content Understanding Studio fournit une interface visuelle pour créer un projet, définir un schéma Content Understanding et générer et tester un analyseur.
Conseil / Astuce
Seuls certains modèles prédéfinis sont disponibles directement dans le portail Microsoft Foundry. Pour la création et le test d’analyseurs personnalisés, utilisez Content Understanding Studio.
Création d’un projet : Compréhension du contenu
Dans Content Understanding Studio, vous pouvez créer un projet associé à une ressource Microsoft Foundry. La création d’un projet provisionne les ressources Azure nécessaires pour prendre en charge votre solution Content Understanding, notamment le stockage et une ressource de coffre de clés pour stocker des détails sensibles tels que les informations d’identification et les clés.
Remarque
Les schémas Content Understanding ne peuvent être créés que dans des emplacements Azure où le service est pris en charge. Pour plus d’informations, consultez la prise en charge des régions et des langues pour la compréhension du contenu.
Définition d’un schéma
Une fois un projet créé, la première étape de la génération d’un analyseur consiste à définir un schéma indiquant le contenu à traiter par l’analyseur et les informations à extraire. Content Understanding Studio fournit une interface d’éditeur de schéma dans laquelle vous pouvez charger un fichier (document, image, audio ou vidéo) sur lequel le schéma doit être basé. Vous pouvez ensuite appliquer un modèle de schéma approprié et définir les champs spécifiques que vous souhaitez que l’analyseur identifie.
Remarque
Les modèles et types de champs disponibles dans un schéma dépendent du type de contenu du fichier sur lequel le schéma est basé. Certains types de contenu prennent en charge des fonctionnalités facultatives supplémentaires, notamment l’extraction de codes-barres et de formules à partir de texte dans des documents. Pour plus d’informations sur l’utilisation de Compréhension de contenu avec différents types de contenu, consultez les articles suivants dans la documentation du produit :
Test
Vous pouvez tester le schéma de l’analyseur à tout moment pendant le processus de développement en exécutant une analyse sur l’exemple de fichier utilisé pour définir le schéma ou d’autres fichiers chargés. Les résultats des tests incluent les valeurs de champ extraites et la sortie de format JSON retournée par l’analyseur aux applications clientes.
Génération d’un analyseur
Lorsque vous êtes satisfait du niveau de performance de votre schéma, vous pouvez générer votre analyseur. La création d’un analyseur permet d’accéder aux applications clientes via le point de terminaison de la ressource Microsoft Foundry associée à votre projet.
Après avoir créé votre analyseur, vous pouvez continuer à le tester dans Content Understanding Studio et affiner le schéma pour créer de nouvelles versions nommées avec différentes fonctionnalités.