Competenza cognitiva di Entity Linking (v3)

La competenza Entity Linking (v3) restituisce un elenco di entità riconosciute con collegamenti ad articoli in una knowledge base nota (Wikipedia).

Nota

Questa competenza è associata ai modelli di Machine Learning Entity Linking nel linguaggio di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione di competenze predefinite viene addebitata al prezzo con pagamento in base al consumo dei servizi di intelligenza artificiale di Azure esistente.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limiti dei dati

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli alla competenza EntityLinking, è consigliabile usare la competenza Suddivisione testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.

Parametri della competenza

I nomi dei parametri fanno distinzione tra maiuscole e minuscole e sono tutti facoltativi.

Nome parametro Descrizione
defaultLanguageCode Codice lingua del testo di input. Se il codice lingua predefinito non è specificato, Inglese (en) verrà usato come il codice lingua predefinito.
Vedi l'elenco completo di linguaggi supportati.
minimumPrecision Immettere un valore compreso tra 0 e 1. Se il punteggio di attendibilità (nell'output) è inferiore a questo valore, l'entità entities non viene restituita. Il valore predefinito è 0.
modelVersion (Facoltativo) Specifica la versione del modello da usare quando si chiama il collegamento di entità. L'impostazione predefinita sarà la versione più recente disponibile se non specificata. È consigliabile non specificare questo valore a meno che non sia necessario.

Input competenze

Nome input Descrizione
languageCode Stringa che indica la lingua dei record. Se questo parametro viene omesso, il codice lingua predefinito verrà usato per analizzare i record.
Vedi l'elenco completo di linguaggi supportati.
text Testo da analizzare.

Output competenze

Nome output Descrizione
entities Matrice di tipi complessi che contiene i campi seguenti:
  • "name" (Il nome effettivo dell'entità visualizzato nel testo)
  • "id"
  • "language" (Lingua del testo come determinato dalla competenza)
  • "url" (URL collegato a questa entità)
  • "bingId" (BingId per questa entità collegata)
  • "dataSource" (Origine dati associata all'URL)
  • "matches"(Matrice di tipi complessi che contiene: text, offsetlength e confidenceScore)

Definizione di esempio

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Input di esempio

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Output di esempio

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Gli offset restituiti per le entità nell'output di questa competenza vengono restituiti direttamente dalle API del servizio di linguaggio, ovvero se vengono usate per indicizzare nella stringa originale, è consigliabile usare la classe StringInfo in .NET per estrarre il contenuto corretto. Per altre informazioni, vedere Supporto multilingue ed emoji nelle funzionalità del servizio di linguaggio.

Casi di avviso

Se il codice linguistico per il documento non è supportato, viene restituito un avviso e non vengono estratte entità.

Vedi anche