Entitetslänkning av kognitiv skicklighet (v3)

Entitetslänkningsfärdigheten (v3) returnerar en lista över identifierade entiteter med länkar till artiklar i en välkänd kunskapsbas (Wikipedia).

Kommentar

Den här färdigheten är bunden till machine learning-modeller för entitetslänkning i Azure AI Language och kräver en fakturerbar resurs för transaktioner som överstiger 20 dokument per indexerare och dag. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Databegränsningar

Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till EntityLinking-färdigheten bör du överväga att använda färdigheten Textdelning. Om du använder en textdelningsfärdighet anger du sidlängden till 5 000 för bästa prestanda.

Kompetensparametrar

Parameternamn är skiftlägeskänsliga och är alla valfria.

Parameternamn beskrivning
defaultLanguageCode Språkkod för indatatexten. Om standardspråkkoden inte anges används engelska (en) som standardspråkkod.
Se den fullständiga listan med språk som stöds.
minimumPrecision Ett värde mellan 0 och 1. Om konfidenspoängen entities (i utdata) är lägre än det här värdet returneras inte entiteten. Standardvärdet är 0.
modelVersion (Valfritt) Anger vilken version av modellen som ska användas vid anrop av entitetslänkning. Den är som standard den senaste tillgängliga när den inte har angetts. Vi rekommenderar att du inte anger det här värdet om det inte är nödvändigt.

Kunskapsindata

Indatanamn beskrivning
languageCode En sträng som anger posternas språk. Om den här parametern inte anges används standardspråkkoden för att analysera posterna.
Se den fullständiga listan med språk som stöds.
text Texten som ska analyseras.

Kunskapsutdata

Utdatanamn beskrivning
entities En matris med komplexa typer som innehåller följande fält:
  • "name" (Det faktiska entitetsnamnet som det visas i texten)
  • "id"
  • "language" (Språket i texten som bestäms av färdigheten)
  • "url" (Den länkade URL:en till den här entiteten)
  • "bingId" (bingId för den här länkade entiteten)
  • "dataSource" (Datakällan som är associerad med URL:en)
  • "matches"(En matris med komplexa typer som innehåller: text, offsetlength och confidenceScore)

Exempeldefinition

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Exempelindata

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Exempelutdata

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

De förskjutningar som returneras för entiteter i utdata från den här färdigheten returneras direkt från Api:erna för Språktjänst, vilket innebär att om du använder dem för att indexera till den ursprungliga strängen bör du använda Klassen StringInfo i .NET för att extrahera rätt innehåll. Mer information finns i Stöd för flerspråkiga och emojis i Språktjänstfunktioner.

Varningsfall

Om språkkoden för dokumentet inte stöds returneras en varning och inga entiteter extraheras.

Se även