Définitions et termes de la reconnaissance d’entités nommées personnalisées

Article
12/19/2023

Utilisez cet article pour en savoir plus sur les définitions et les termes que vous pouvez rencontrer pendant l’utilisation de NER personnalisée.

Entité

Une entité est une étendue de texte qui indique un certain type d’informations. L’étendue de texte peut comporter un ou plusieurs mots. Dans l’étendue de la reconnaissance d’entités nommées personnalisées, les entités représentent les informations que l’utilisateur souhaite extraire du texte. Les développeurs étiquettent les entités nécessaires dans leurs données avant de les transmettre au modèle pour l’apprentissage, par exemple « Numéro de facture », « Date de début », « Numéro de livraison », « Lieu de naissance », « Ville d’origine », « Nom du fournisseur » ou « Adresse du client ».

Par exemple, dans la phrase « John a emprunté 25 000 USD à Fred. », les entités peuvent être :

Nom/type de l’entité	Entité
Nom de l’emprunteur	John
Nom du prêteur	Fred
Montant du prêt	25 000 USD

Score F1

Le score F1 est une fonction de précision et de rappel. Il est nécessaire quand vous recherchez un équilibre entre précision et rappel.

Modèle

Un modèle est un objet qui a été entraîné à réaliser une tâche en particulier, dans ce cas la reconnaissance d’entités nommées personnalisées. Pour effectuer l’apprentissage du modèle, vous lui fournissez des données étiquetées qu’il apprend et qu’il utilise ensuite pour les tâches de reconnaissance.

L’apprentissage du modèle est le processus qui consiste à apprendre à votre modèle ce qu’il faut extraire à partir de vos données étiquetées.
L’évaluation du modèle est le processus qui se produit juste après l’entraînement pour savoir si le modèle est performant.
Le déploiement est le processus qui consiste à affecter le modèle à un déploiement pour le rendre utilisable avec l’API de prédiction.

Precision

Mesure la précision, ou exactitude, de votre modèle. Il s’agit du rapport entre les positifs correctement identifiés (vrais positifs) et tous les positifs identifiés. La métrique de précision révèle le nombre de classes prédites qui sont correctement étiquetées.

Project

Un projet est une zone de travail qui vous permet de créer des modèles ML personnalisés en fonction de vos données. Vous et les autres personnes qui disposent d’un accès à la ressource Azure utilisée peuvent accéder à votre projet. Pour pouvoir créer un projet d’extraction d’entités personnalisées, vous devez connecter votre ressource à un compte de stockage avec votre jeu de données quand vous créez un projet. Votre projet comprend automatiquement tous les fichiers .txt disponibles dans votre conteneur.

Dans votre projet, vous pouvez effectuer les opérations suivantes :

Étiquetage des données : processus d’étiquetage de vos données qui permet à votre modèle d’apprendre ce que vous voulez extraire dans le cadre de son apprentissage.
Création et apprentissage du modèle : étape principale de votre projet, où votre modèle commence à apprendre à partir de vos données étiquetées.
Voir les détails de l’évaluation du modèle : consultez les performances de votre modèle pour déterminer si des améliorations sont possibles ou si vous êtes satisfait des résultats.
Déploiement : processus qui consiste à affecter votre modèle à un déploiement après avoir vérifié ses performances et conclu qu’il peut être exploité dans votre environnement. Il sera ainsi utilisable avec l’API de prédiction.
Test du modèle : test du déploiement de votre modèle dans Language Studio pour voir comment il fonctionnerait en production.

Rappel

Mesure la capacité du modèle à prédire les classes positives réelles. Il s’agit du rapport entre les vrais positifs prédits et ce qui a été réellement étiqueté. La métrique de rappel révèle le nombre de classes prédites correctes.