Qu’est-ce que la reconnaissance d’entités nommées personnalisées ?

Article
12/19/2023

La Reconnaissance d’entité nommée personnalisée est l’une des fonctionnalités proposées par Azure AI Language. Il s’agit d’un service d’API informatique qui applique l’intelligence du Machine Learning pour vous permettre de construire des modèles personnalisés pour les tâches de reconnaissance d’entités nommées dans du texte.

La Reconnaissance d’entité nommée permet aux utilisateurs de créer des modèles IA personnalisés pour extraire des entités spécifiques à un domaine à partir d’un contenu textuel non structuré, par exemple des contrats ou des documents financiers. En créant un projet de reconnaissance d’entité nommée personnalisée, les développeurs peuvent non seulement étiqueter les données d’un modèle mais aussi l’entraîner, l’évaluer et améliorer ses performances de façon itérative avant de le rendre disponible pour qu’il soit consommé. La qualité des données étiquetées impacte considérablement les performances du modèle. Pour simplifier la création et la personnalisation de votre modèle, le service offre un portail web personnalisé accessible dans Langage Studio. Vous pouvez facilement commencer à utiliser le service en suivant les étapes de ce guide de démarrage rapide.

Cette documentation contient les types d’articles suivants :

Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
Des concepts fournissent des explications sur les fonctionnalités du service.
Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Exemples de scénarios d’utilisation

La reconnaissance d’entités nommées personnalisées peut être utilisée dans plusieurs scénarios dans divers secteurs d’activité :

Extraction d’informations

De nombreuses organisations financières et juridiques extraient et normalisent quotidiennement les données de milliers de sources de texte complexes non structurées. Ces sources incluent les relevés bancaires, les accords juridiques ou les formulaires bancaires. Par exemple, l’extraction des données d’application hypothécaire effectuée manuellement par des réviseurs humains peut prendre plusieurs jours. L’automatisation de ces étapes par la création d’un modèle NER personnalisé simplifie le processus et permet de réaliser des économies en termes de coûts, de temps et d’efforts.

Exploration des connaissances pour améliorer/enrichir la recherche sémantique

La recherche est fondamentale pour toute application qui présente du contenu textuel aux utilisateurs. Les scénarios courants incluent la recherche dans des catalogues ou des documents, la recherche de produits de vente au détail ou l’exploration de connaissances pour la science des données. De nombreuses entreprises issues de divers secteurs souhaitent créer une expérience de recherche enrichie à partir d’un contenu privé hétérogène comprenant à la fois des documents structurés et des documents non structurés. Dans le cadre de leur pipeline, les développeurs peuvent utiliser une NER personnalisée afin d’extraire du texte les entités pertinentes pour leur secteur d’activité. Ces entités peuvent être utilisées pour enrichir l’indexation du fichier afin d’offrir une expérience de recherche plus personnalisée.

Audit et conformité

Au lieu d’examiner manuellement des fichiers texte très longs pour effectuer des audits et appliquer des stratégies, les services informatiques des entreprises financières ou juridiques peuvent utiliser la NER personnalisée pour élaborer des solutions automatisées. Ces solutions peuvent permettre d’appliquer les stratégies de conformité et de configurer les règles d’entreprise nécessaires en fonction des pipelines d’extraction de connaissances qui traitent des contenus structurés et non structurés.

Cycle de vie du développement de projet

L’utilisation d’une NER personnalisée implique généralement plusieurs étapes distinctes.

Définir le schéma : familiarisez-vous avec vos données et identifiez les entités à extraire. Évitez les ambiguïtés.
Étiqueter vos données : l’étiquetage des données est un facteur clé pour déterminer les performances du modèle. Étiquetez de façon précise, cohérente et complète.
1. Étiqueter avec précision : étiquetez toujours chaque entité en utilisant le type approprié. Incluez uniquement ce que vous souhaitez extraire, évitez les données inutiles dans vos étiquettes.
2. Étiqueter de manière cohérente : la même entité doit avoir la même étiquette dans tous les fichiers.
3. Étiqueter de manière complète : étiquetez toutes les instances de l’entité dans tous vos fichiers.
Entraîner le modèle : votre modèle commence à apprendre à partir de vos données étiquetées.
Voir les performances du modèle : une fois l’entraînement effectué, visualisez les détails de l’évaluation du modèle, ses performances et des lignes directrices pour l’améliorer.
Déployer le modèle : le déploiement d’un modèle permet de l’utiliser avec l’API Analyse.
Extraire les entités : utilisez vos modèles personnalisés pour les tâches d’extraction d’entités.

Documentation de référence et exemples de code

Quand vous utilisez la Reconnaissance d’entité nommée personnalisée, consultez la documentation de référence et les échantillons suivants pour Azure AI Language :

Option de développement/langage	Documentation de référence	Exemples
API REST (création)	Documentation des API REST
API REST (runtime)	Documentation des API REST
C# (Runtime)	Documentation C#	Exemples C#
Java (Runtime)	Documentation Java	Exemples Java
JavaScript (Runtime)	Documentation JavaScript	Exemples JavaScript
Python (Runtime)	Documentation Python	Exemples Python

Intelligence artificielle responsable

Un système IA comprend non seulement la technologie, mais aussi les personnes qui l’utiliseront, les personnes qui seront affectées par lui et l’environnement dans lequel il est déployé. Lisez la Note de transparence pour la Reconnaissance d’entité nommée personnalisée pour en savoir plus sur l’utilisation et le déploiement de l’IA responsable dans vos systèmes. Vous pouvez également consulter les articles suivants pour plus d’informations :

Étapes suivantes

Utilisez l’article de démarrage rapide pour commencer à utiliser la reconnaissance d’entité nommée personnalisée.
Au fur et à mesure que vous parcourez le cycle de vie du développement de projet, consultez le glossaire afin d’en savoir plus sur les termes utilisés dans la documentation pour cette fonctionnalité.
N’oubliez pas de consulter les limites du service pour plus d’informations, comme la disponibilité régionale.