Compétence cognitive Liaison d’entités (v3)
La compétence Liaison d'entités (v3) renvoie une liste d'entités reconnues avec des liens vers des articles dans une base de connaissances bien connue (Wikipédia).
Remarque
Cette compétence est liée aux modèles Machine Learning Liaison d'entités dans Azure AI Language, et nécessite une ressource facturable pour les transactions qui dépassent 20 documents par indexeur et par jour. L'exécution des compétences intégrées est facturée au prix actuel du paiement à l'utilisation des services Azure AI.
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
Limites de données
La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length
. Si vous devez subdiviser vos données avant de les envoyer à la compétence Liaison d’entités, songez utiliser la compétence Fractionnement de texte. Si vous utilisez une compétence de fractionnement de texte, définissez la longueur de la page sur 5 000 pour obtenir les meilleures performances.
Paramètres de la compétence
Les noms de paramètres sont sensibles à la casse et sont tous facultatifs.
Nom du paramètre | Description |
---|---|
defaultLanguageCode |
Code de langue du texte d’entrée. Si le code du langage par défaut n’est pas spécifié, l’anglais (en) est utilisé comme code de langage par défaut. Voir la liste complète des langues prises en charge. |
minimumPrecision |
Valeur comprise entre 0 et 1 Si le score de confiance (dans la sortie entities ) est inférieur à cette valeur, l’entité n’est pas retournée. La valeur par défaut est 0. |
modelVersion |
(Facultatif) Spécifie la version du modèle à utiliser pour appeler la liaison d'entités. Si rien n’est spécifié, c’est la dernière version disponible qui est utilisée par défaut. Nous vous recommandons de ne pas spécifier cette valeur, sauf nécessité. |
Entrées de la compétence
Nom de l'entrée | Description |
---|---|
languageCode |
Chaîne indiquant la langue des enregistrements. Si ce paramètre n’est pas spécifié, le code de langue par défaut est utilisé pour l’analyse des enregistrements. Voir la liste complète des langues prises en charge. |
text |
Texte à analyser. |
Sorties de la compétence
Nom de sortie | Description |
---|---|
entities |
Tableau de types complexes contenant les champs suivants :
|
Exemple de définition
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
Exemple d’entrée
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
Exemple de sortie
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
Les décalages renvoyés pour les entités dans la sortie de cette compétence le sont directement à partir des API du service de langage, ce qui signifie que, si vous les utilisez pour indexer dans la chaîne d'origine, vous devez utiliser la classe StringInfo dans .NET afin d'extraire le bon contenu. Pour plus d’informations, consultez Prise en charge de plusieurs langues et des emojis dans les fonctionnalités du service de langage.
Cas d’avertissement
Si le code de langue du document n’est pas pris en charge, un avertissement est retourné et aucune entité n’est extraite.