Composants d’entité dans Analyse de texte personnalisée pour la santé

Article
09/03/2024

Dans Analyse de texte personnalisée pour la santé, les entités sont des éléments d’information pertinents extraits de votre texte d’entrée non structuré. Une entité peut être extraite par différentes méthodes. Elles peuvent être apprises par le biais d’un contexte, d’une correspondance à partir d’une liste ou détectées par une entité reconnue prédéfinie. Chaque entité de votre projet est constituée d’une ou de plusieurs de ces méthodes, qui sont définies en tant que composants de votre entité. Quand une entité est définie par plusieurs composants, leurs prédictions peuvent se chevaucher. Vous pouvez déterminer le comportement d’une prédiction d’entité quand ses composants se chevauchent en utilisant un ensemble fixe d’options dans les options d’entité.

Types de composants

Un composant d’entité détermine la façon dont vous pouvez extraire l’entité. Une entité peut contenir un composant, qui détermine la seule méthode qui serait utilisée pour extraire l’entité, ou plusieurs composants pour étendre la manière dont l’entité est définie et extraite.

Ces entités Analyse de texte pour la santé sont chargées automatiquement dans votre projet en tant qu’entités avec des composants prédéfinis. Vous pouvez définir des composants de liste pour les entités avec des composants prédéfinis, mais vous ne pouvez pas ajouter de composants appris. De même, vous pouvez créer de nouvelles entités avec des composants appris et de liste, mais vous ne pouvez pas les remplir avec des composants prédéfinis supplémentaires.

Composant appris

Le composant appris utilise les étiquettes d’entité avec lesquelles vous étiquetez votre texte pour entraîner un modèle issu du machine learning. Le modèle apprend à prédire l’emplacement de l’entité, en fonction du contexte dans le texte. Vos étiquettes fournissent des exemples d’emplacement où l’entité est attendue dans le texte, en fonction de la signification des mots qui l’entourent et des mots qui ont été étiquetés. Ce composant est défini seulement si vous ajoutez des étiquettes à vos données pour l’entité. Si vous n’étiquetez aucune donnée, elles n’auront pas de composants appris.

Les entités Analyse de texte pour la santé, qui ont par défaut des composants prédéfinis, ne peuvent pas être étendus avec des composants appris, ce qui signifie qu’ils ne nécessitent pas ou n’acceptent pas d’étiquetage supplémentaire pour fonctionner.

Composant de liste

Le composant de liste représente un ensemble fixe, fermé de mots associés ainsi que leurs synonymes. Le composant effectue une correspondance de texte exacte avec la liste de valeurs que vous fournissez en tant que synonymes. Chaque synonyme appartient à une « clé de liste » qui peut être utilisée comme valeur standard normalisée pour le synonyme retourné dans la sortie si le composant de liste est mis en correspondance. Les clés de liste ne sont pas utilisées pour la correspondance.

Dans les projets multilingues, vous pouvez spécifier un ensemble différent de synonymes pour chaque langue. Lors de l’utilisation de l’API de prédiction, vous pouvez spécifier la langue dans la demande d’entrée, qui correspond uniquement aux synonymes associés à cette langue.

Composant prédéfini

Options d’entité

Quand plusieurs composants sont définis pour une entité, leurs prédictions peuvent se chevaucher. En cas de chevauchement, la prédiction finale de chaque entité est déterminée par l’une des options suivantes.

Combiner les composants

Combinez des composants en tant qu’entité lorsqu’ils se chevauchent en considéra,t l’union de tous les composants.

Utilisez cette option pour combiner tous les composants lorsqu’ils se chevauchent. Lorsque des composants sont combinés, vous obtenez toutes les informations supplémentaires liées à une liste ou à un composant prédéfini lorsqu’ils sont présents.

Exemple

Supposons que vous disposez d’une entité appelée Logiciel qui a un composant de liste qui contient « Système d’exploitation Proseware » comme entrée. Dans vos données d’entrée, vous avez « Je veux acheter Proseware OS 9 » avec « Proseware OS 9 » étiqueté en tant que « logiciel » :

En utilisant la combinaison de composants, l’entité retourne le contexte complet sous la forme « Wareware OS 9 » avec la clé du composant de liste :

Supposez que vous ayez le même énoncé, mais que seul « OS 9 » a été prédit par le composant appris :

Avec la combinaison de composants, l’entité retourne toujours « WareWARE OS 9 » avec la clé du composant de liste :

Ne pas combiner des composants

Chaque composant qui se chevauche redevient une instance distincte de l’entité. Appliquez votre propre logique après la prédiction avec cette option.

Exemple

Supposons que vous disposez d’une entité appelée Logiciel qui a un composant de liste qui contient « Proseware Desktop » comme entrée. Dans vos données étiquetées, vous avez « Je veux acheter Proseware Desktop Pro » avec « Proseware Desktop Pro » étiqueté comme « logiciel » :

Lorsque vous ne combinez pas de composants, l’entité retourne à deux reprises :

Comment utiliser des composants et des options

Les composants vous donnent la possibilité de définir votre entité de plusieurs manières. Lorsque vous combinez des composants, assurez-vous que chaque composant est représenté et que vous réduisez le nombre d’entités retournées dans vos prédictions.

Une pratique courante consiste à étendre un composant prédéfini avec une liste de valeurs que le prédéfini peut ne pas prendre en charge. Par exemple, si vous avez une entité Nom de médicament, à laquelle un composant prédéfini Medication.Name a été ajouté, l’entité peut ne pas prédire tous les noms de médicaments spécifiques à votre domaine. Vous pouvez utiliser un composant de liste pour étendre les valeurs de l’entité Nom de médicament et ainsi étendre le composant prédéfini avec vos propres valeurs de Nom de médicament.

D’autres fois, vous pouvez être intéressé par l’extraction d’une entité via un contexte, comme un appareil médical. Vous devez étiqueter le composant appris de l’appareil médical pour savoir où se trouve un appareil médical en fonction de sa position dans la phrase. Vous pouvez aussi avoir une liste d’appareils médicaux que vous connaissiez déjà auparavant et que vous aimeriez extraire. La combinaison des deux composants dans une entité vous permet d’obtenir les deux options de l’entité.

Lorsque vous ne combinez pas de composants, vous autorisez chaque composant à faire office d’extracteur d’entité indépendant. Une façon d’utiliser cette option consiste à séparer les entités extraites d’une liste par rapport aux entités extraites par le biais des composants appris ou prédéfinis afin de les gérer et de les traiter différemment.

Étapes suivantes

Entités avec des composants prédéfinis

Partager via

Composants d’entité dans Analyse de texte personnalisée pour la santé

Types de composants

Composant appris

Composant de liste

Composant prédéfini

Options d’entité

Combiner les composants

Exemple

Ne pas combiner des composants

Exemple

Comment utiliser des composants et des options

Étapes suivantes

Commentaires

Ressources supplémentaires