Competenza cognitiva riconoscimento entità denominata (v2)

Articolo
11/15/2023

La competenza Riconoscimento entità denominata (v2) estrae entità denominate dal testo. Le entità disponibili includono i tipi person, location e organization.

Importante

La competenza di riconoscimento delle entità denominata (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) è ora stata sostituita da Microsoft.Skills.Text.V3.EntityRecognitionSkill. Seguire le raccomandazioni riportate in Competenze deprecate di Ricerca intelligenza artificiale di Azure per eseguire la migrazione a una competenza supportata.

Nota

Man mano che si espande l'ambito aumentando la frequenza di elaborazione, aggiungendo altri documenti o aggiungendo altri algoritmi di intelligenza artificiale, sarà necessario collegare una risorsa dei servizi di intelligenza artificiale di Azure fatturabile. Gli addebiti si accumulano quando si chiamano le API nei servizi di intelligenza artificiale di Azure e per l'estrazione di immagini come parte della fase di creazione di documenti in Ricerca di intelligenza artificiale di Azure. Non sono previsti addebiti per l'estrazione di testo dai documenti. L'esecuzione di competenze predefinite viene addebitata al prezzo con pagamento in base al consumo dei servizi di intelligenza artificiale di Azure esistente.

L'estrazione di immagini è un addebito aggiuntivo a consumo da Ricerca di intelligenza artificiale di Azure, come descritto nella pagina dei prezzi. L'estrazione del testo è libera.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Limiti dei dati

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli all'estrattore di frasi chiave, è possibile usare la competenza Divisione del testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.

Parametri della competenza

I parametri fanno distinzione tra maiuscole e minuscole.

Nome parametro	Descrizione
Categorie	Matrice di categorie che devono essere estratte. Possibili tipologie di categorie: `"Person"`, `"Location"`, `"Organization"`. Se non vengono fornite categorie, vengono restituiti tutti i tipi.
defaultLanguageCode	Codice lingua del testo di input. Sono supportate le lingue seguenti: `de, en, es, fr, it`
minimumPrecision	Un numero compreso tra 0 e 1. Se la precisione è inferiore a questo valore, non viene restituita l'entità. Il valore predefinito è 0.

Input competenze

Nome input	Descrizione
languageCode	(Facoltativo). Il valore predefinito è `"en"`.
testo	Testo da analizzare.

Output competenze

Nome output	Descrizione
persons	Una matrice di stringhe in cui ogni stringa rappresenta il nome di una persona.
locations	Una matrice di stringhe in cui ogni stringa rappresenta il nome una posizione.
organizations	Una matrice di stringhe in cui ogni stringa rappresenta un'organizzazione.
entities	Una matrice di tipi complessi. Ogni tipo complesso include i campi seguenti: category (`"person"`, `"organization"` o `"location"`) value (nome entità effettivo) offset (percorso in cui è stato trovato nel testo) confidence (un valore compreso tra 0 e 1 che rappresenta l'attendibilità che il valore sia di un'entità effettiva)

Definizione di esempio

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Input di esempio

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Output di esempio

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Casi di avviso

Se il codice linguistico per il documento non è supportato, viene restituito un avviso e non vengono estratte entità.

Condividi tramite