Cognitieve vaardigheid Entity Linking (v3)

De Entity Linking-vaardigheid (v3) retourneert een lijst met herkende entiteiten met koppelingen naar artikelen in een bekende Knowledge Base (Wikipedia).

Notitie

Deze vaardigheid is gebonden aan de Machine Learning-modellen entity linking in Azure AI Language en vereist een factureerbare resource voor transacties die groter zijn dan 20 documenten per indexeerfunctie per dag. Voor de uitvoering van ingebouwde vaardigheden worden kosten in rekening gebracht voor de bestaande betalen per gebruik-prijs van Azure AI-services.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Gegevenslimieten

De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length. Als u uw gegevens moet opsplitsen voordat u deze naar de EntityLinking-vaardigheid verzendt, kunt u overwegen de vaardigheid Tekst splitsen te gebruiken. Als u een vaardigheid voor tekstsplitsing gebruikt, stelt u de paginalengte in op 5000 voor de beste prestaties.

Vaardigheidsparameters

Parameternamen zijn hoofdlettergevoelig en zijn allemaal optioneel.

Parameternaam Beschrijving
defaultLanguageCode Taalcode van de invoertekst. Als de standaardtaalcode niet is opgegeven, wordt Engels (en) gebruikt als de standaardtaalcode.
Zie de volledige lijst met ondersteunde talen.
minimumPrecision Een waarde tussen 0 en 1. Als de betrouwbaarheidsscore (in de entities uitvoer) lager is dan deze waarde, wordt de entiteit niet geretourneerd. De standaardwaarde is 0.
modelVersion (Optioneel) Hiermee geeft u de versie van het model op die moet worden gebruikt bij het aanroepen van entiteitskoppelingen. Deze wordt standaard ingesteld op de meest recente versie wanneer deze niet is opgegeven. U wordt aangeraden deze waarde niet op te geven, tenzij dit nodig is.

Invoer van vaardigheden

Invoernaam Beschrijving
languageCode Een tekenreeks die de taal van de records aangeeft. Als deze parameter niet is opgegeven, wordt de standaardtaalcode gebruikt om de records te analyseren.
Zie de volledige lijst met ondersteunde talen.
text De te analyseren tekst.

Uitvoer van vaardigheden

Uitvoernaam Beschrijving
entities Een matrix met complexe typen die de volgende velden bevatten:
  • "name" (De werkelijke entiteitsnaam zoals deze wordt weergegeven in de tekst)
  • "id"
  • "language" (De taal van de tekst zoals bepaald door de vaardigheid)
  • "url" (De gekoppelde URL naar deze entiteit)
  • 'bingId' (De bingId voor deze gekoppelde entiteit)
  • "dataSource" (De gegevensbron die is gekoppeld aan de URL)
  • "matches"(Een matrix van complexe typen die: text, offsetlength en confidenceScore)

Voorbeelddefinitie

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Voorbeeldinvoer

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Voorbeelduitvoer

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

De offsets die worden geretourneerd voor entiteiten in de uitvoer van deze vaardigheid, worden rechtstreeks geretourneerd door de Language Service-API's. Dit betekent dat als u ze gebruikt om te indexeren in de oorspronkelijke tekenreeks, u de stringInfo-klasse in .NET moet gebruiken om de juiste inhoud te extraheren. Zie Ondersteuning voor meertalige en emoji's in taalservicefuncties voor meer informatie.

Waarschuwingscases

Als de taalcode voor het document niet wordt ondersteund, wordt er een waarschuwing geretourneerd en worden er geen entiteiten geëxtraheerd.

Zie ook