Partager via


Composants d’entité dans Analyse de texte personnalisée pour la santé

Dans Analyse de texte personnalisée pour la santé, les entités sont des éléments d’information pertinents extraits de votre texte d’entrée non structuré. Une entité peut être extraite par différentes méthodes. Elles peuvent être apprises par le biais d’un contexte, d’une correspondance à partir d’une liste ou détectées par une entité reconnue prédéfinie. Chaque entité de votre projet est constituée d’une ou de plusieurs de ces méthodes, qui sont définies en tant que composants de votre entité. Quand une entité est définie par plusieurs composants, leurs prédictions peuvent se chevaucher. Vous pouvez déterminer le comportement d’une prédiction d’entité quand ses composants se chevauchent en utilisant un ensemble fixe d’options dans les options d’entité.

Types de composants

Un composant d’entité détermine la façon dont vous pouvez extraire l’entité. Une entité peut contenir un composant, qui détermine la seule méthode qui serait utilisée pour extraire l’entité, ou plusieurs composants pour étendre la manière dont l’entité est définie et extraite.

Ces entités Analyse de texte pour la santé sont chargées automatiquement dans votre projet en tant qu’entités avec des composants prédéfinis. Vous pouvez définir des composants de liste pour les entités avec des composants prédéfinis, mais vous ne pouvez pas ajouter de composants appris. De même, vous pouvez créer de nouvelles entités avec des composants appris et de liste, mais vous ne pouvez pas les remplir avec des composants prédéfinis supplémentaires.

Composant appris

Le composant appris utilise les étiquettes d’entité avec lesquelles vous étiquetez votre texte pour entraîner un modèle issu du machine learning. Le modèle apprend à prédire l’emplacement de l’entité, en fonction du contexte dans le texte. Vos étiquettes fournissent des exemples d’emplacement où l’entité est attendue dans le texte, en fonction de la signification des mots qui l’entourent et des mots qui ont été étiquetés. Ce composant est défini seulement si vous ajoutez des étiquettes à vos données pour l’entité. Si vous n’étiquetez aucune donnée, elles n’auront pas de composants appris.

Les entités Analyse de texte pour la santé, qui ont par défaut des composants prédéfinis, ne peuvent pas être étendus avec des composants appris, ce qui signifie qu’ils ne nécessitent pas ou n’acceptent pas d’étiquetage supplémentaire pour fonctionner.

Capture d’écran montrant un exemple de composants appris pour des entités

Composant de liste

Le composant de liste représente un ensemble fixe, fermé de mots associés ainsi que leurs synonymes. Le composant effectue une correspondance de texte exacte avec la liste de valeurs que vous fournissez en tant que synonymes. Chaque synonyme appartient à une « clé de liste » qui peut être utilisée comme valeur standard normalisée pour le synonyme retourné dans la sortie si le composant de liste est mis en correspondance. Les clés de liste ne sont pas utilisées pour la correspondance.

Dans les projets multilingues, vous pouvez spécifier un ensemble différent de synonymes pour chaque langue. Lors de l’utilisation de l’API de prédiction, vous pouvez spécifier la langue dans la demande d’entrée, qui correspond uniquement aux synonymes associés à cette langue.

Capture d’écran montrant un exemple de composants de liste pour des entités

Composant prédéfini

Ces entités Analyse de texte pour la santé sont chargées automatiquement dans votre projet en tant qu’entités avec des composants prédéfinis. Vous pouvez définir des composants de liste pour les entités avec des composants prédéfinis, mais vous ne pouvez pas ajouter de composants appris. De même, vous pouvez créer de nouvelles entités avec des composants appris et de liste, mais vous ne pouvez pas les remplir avec des composants prédéfinis supplémentaires. Les entités avec des composants prédéfinis sont préentraînées et peuvent extraire des informations relatives à leurs catégories sans étiquette.

Capture d’écran montrant un exemple de composants prédéfinis pour des entités

Options d’entité

Quand plusieurs composants sont définis pour une entité, leurs prédictions peuvent se chevaucher. En cas de chevauchement, la prédiction finale de chaque entité est déterminée par l’une des options suivantes.

Combiner les composants

Combinez des composants en tant qu’entité lorsqu’ils se chevauchent en considéra,t l’union de tous les composants.

Utilisez cette option pour combiner tous les composants lorsqu’ils se chevauchent. Lorsque des composants sont combinés, vous obtenez toutes les informations supplémentaires liées à une liste ou à un composant prédéfini lorsqu’ils sont présents.

Exemple

Supposons que vous disposez d’une entité appelée Logiciel qui a un composant de liste qui contient « Système d’exploitation Proseware » comme entrée. Dans vos données d’entrée, vous avez « Je veux acheter Proseware OS 9 » avec « Proseware OS 9 » étiqueté en tant que « logiciel » :

Capture d’écran montrant une entité apprise et listée qui est chevauchée.

En utilisant la combinaison de composants, l’entité retourne le contexte complet sous la forme « Wareware OS 9 » avec la clé du composant de liste :

Capture d’écran montrant le résultat d’un composant combiné.

Supposez que vous ayez le même énoncé, mais que seul « OS 9 » a été prédit par le composant appris :

Capture d’écran montrant un énoncé avec OS 9 prédit par le composant appris.

Avec la combinaison de composants, l’entité retourne toujours « WareWARE OS 9 » avec la clé du composant de liste :

Capture d’écran montrant l’entité logicielle retournée.

Ne pas combiner des composants

Chaque composant qui se chevauche redevient une instance distincte de l’entité. Appliquez votre propre logique après la prédiction avec cette option.

Exemple

Supposons que vous disposez d’une entité appelée Logiciel qui a un composant de liste qui contient « Proseware Desktop » comme entrée. Dans vos données étiquetées, vous avez « Je veux acheter Proseware Desktop Pro » avec « Proseware Desktop Pro » étiqueté comme « logiciel » :

Capture d’écran montrant un exemple d’entité apprise et listée qui est chevauchée.

Lorsque vous ne combinez pas de composants, l’entité retourne à deux reprises :

Capture d’écran montrant l’entité retournée deux fois.

Comment utiliser des composants et des options

Les composants vous donnent la possibilité de définir votre entité de plusieurs manières. Lorsque vous combinez des composants, assurez-vous que chaque composant est représenté et que vous réduisez le nombre d’entités retournées dans vos prédictions.

Une pratique courante consiste à étendre un composant prédéfini avec une liste de valeurs que le prédéfini peut ne pas prendre en charge. Par exemple, si vous avez une entité Nom de médicament, à laquelle un composant prédéfini Medication.Name a été ajouté, l’entité peut ne pas prédire tous les noms de médicaments spécifiques à votre domaine. Vous pouvez utiliser un composant de liste pour étendre les valeurs de l’entité Nom de médicament et ainsi étendre le composant prédéfini avec vos propres valeurs de Nom de médicament.

D’autres fois, vous pouvez être intéressé par l’extraction d’une entité via un contexte, comme un appareil médical. Vous devez étiqueter le composant appris de l’appareil médical pour savoir se trouve un appareil médical en fonction de sa position dans la phrase. Vous pouvez aussi avoir une liste d’appareils médicaux que vous connaissiez déjà auparavant et que vous aimeriez extraire. La combinaison des deux composants dans une entité vous permet d’obtenir les deux options de l’entité.

Lorsque vous ne combinez pas de composants, vous autorisez chaque composant à faire office d’extracteur d’entité indépendant. Une façon d’utiliser cette option consiste à séparer les entités extraites d’une liste par rapport aux entités extraites par le biais des composants appris ou prédéfinis afin de les gérer et de les traiter différemment.

Étapes suivantes