Compétence cognitive Liaison d’entités (v3)

La compétence Liaison d'entités (v3) renvoie une liste d'entités reconnues avec des liens vers des articles dans une base de connaissances bien connue (Wikipédia).

Remarque

Cette compétence est liée aux modèles Machine Learning Liaison d'entités dans Azure AI Language, et nécessite une ressource facturable pour les transactions qui dépassent 20 documents par indexeur et par jour. L'exécution des compétences intégrées est facturée au prix actuel du paiement à l'utilisation des services Azure AI.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limites de données

La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length. Si vous devez subdiviser vos données avant de les envoyer à la compétence Liaison d’entités, songez utiliser la compétence Fractionnement de texte. Si vous utilisez une compétence de fractionnement de texte, définissez la longueur de la page sur 5 000 pour obtenir les meilleures performances.

Paramètres de la compétence

Les noms de paramètres sont sensibles à la casse et sont tous facultatifs.

Nom du paramètre Description
defaultLanguageCode Code de langue du texte d’entrée. Si le code du langage par défaut n’est pas spécifié, l’anglais (en) est utilisé comme code de langage par défaut.
Voir la liste complète des langues prises en charge.
minimumPrecision Valeur comprise entre 0 et 1 Si le score de confiance (dans la sortie entities) est inférieur à cette valeur, l’entité n’est pas retournée. La valeur par défaut est 0.
modelVersion (Facultatif) Spécifie la version du modèle à utiliser pour appeler la liaison d'entités. Si rien n’est spécifié, c’est la dernière version disponible qui est utilisée par défaut. Nous vous recommandons de ne pas spécifier cette valeur, sauf nécessité.

Entrées de la compétence

Nom de l'entrée Description
languageCode Chaîne indiquant la langue des enregistrements. Si ce paramètre n’est pas spécifié, le code de langue par défaut est utilisé pour l’analyse des enregistrements.
Voir la liste complète des langues prises en charge.
text Texte à analyser.

Sorties de la compétence

Nom de sortie Description
entities Tableau de types complexes contenant les champs suivants :
  • "name" (nom réel de l’entité tel qu’il apparaît dans le texte)
  • "id"
  • "language" (langue du texte déterminée par la compétence)
  • "url" (URL liée à cette entité)
  • « bingId » (bingId pour cette entité liée)
  • "dataSource" (source de données associée à l’URL)
  • "matches" (tableau de types complexes contenant : text, offset, length et confidenceScore)

Exemple de définition

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Exemple d’entrée

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Exemple de sortie

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Les décalages renvoyés pour les entités dans la sortie de cette compétence le sont directement à partir des API du service de langage, ce qui signifie que, si vous les utilisez pour indexer dans la chaîne d'origine, vous devez utiliser la classe StringInfo dans .NET afin d'extraire le bon contenu. Pour plus d’informations, consultez Prise en charge de plusieurs langues et des emojis dans les fonctionnalités du service de langage.

Cas d’avertissement

Si le code de langue du document n’est pas pris en charge, un avertissement est retourné et aucune entité n’est extraite.

Voir aussi