Aptitud cognitiva para la vinculación de entidad (v3)

La aptitud Vinculación de entidad devuelve una lista de entidades reconocidas con vínculos a artículos de una base de conocimientos popular (Wikipedia).

Nota:

Esta aptitud está enlazada a los modelo de Machine Learning de vinculación de entidad en Lenguaje de Azure AI y necesita un recurso facturable para las transacciones que superan los 20 documentos por indexador al día. La ejecución de aptitudes integradas se carga al actual precio de pago por uso de los servicios de Azure AI.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Límites de datos

El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si necesita desglosar los datos antes de enviarlos a la aptitud EntityLinking, puede usar la aptitud División de texto. Si usa una aptitud de división de texto, establezca la longitud de la página en 5000 para obtener el mejor rendimiento.

Parámetros de la aptitud

Los nombres de los parámetros distinguen mayúsculas de minúsculas y son opcionales.

Nombre de parámetro Descripción
defaultLanguageCode Código de idioma del texto de entrada. Si no se especifica el código de idioma predeterminado, se usará el inglés (en).
Vea Full list of supported languages (Lista completa de idiomas admitidos).
minimumPrecision Un valor entre 0 y 1. Si la puntuación de confianza (en el resultado entities) es inferior a este valor, no se devuelve la entidad. El valor predeterminado es 0.
modelVersion (Opcional) Especifica la versión del modelo que se va a usar al llamar a la vinculación de entidad. Si no se especifica, el valor predeterminado será el más reciente disponible. Se recomienda no especificar este valor a menos que sea necesario.

Entradas de la aptitud

Nombre de entrada Descripción
languageCode Cadena que indica el idioma de los registros. Si no se especifica este parámetro, el código de idioma predeterminado se utilizará para analizar los registros.
Vea Full list of supported languages (Lista completa de idiomas admitidos).
text Texto que se analizará.

Salidas de la aptitud

Nombre de salida Descripción
entities Una matriz de tipos complejos, que contiene los siguientes campos:
  • "name" (nombre de la entidad real tal como aparece en el texto)
  • "id"
  • "language" (idioma del texto según lo establecido por la aptitud)
  • "url" (la dirección URL vinculada a esta entidad)
  • "bingId" (bingId para esta entidad vinculada)
  • "dataSource" (el origen de datos asociado a la dirección URL)
  • "matches" (matriz de tipos complejos que contiene: text, offset, length y confidenceScore)

Definición de ejemplo

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Entrada de ejemplo

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Salida de ejemplo

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Los desplazamientos devueltos para las entidades en la salida de esta aptitud se devuelven directamente desde las API de Language Service, lo que significa que si los usa para indexar en la cadena original, debe usar la clase StringInfo en .NET a fin de extraer el contenido correcto. Para obtener más información, vea Compatibilidad con varios idiomas y con emojis en características de Language Service.

Casos de advertencia

Si el código de idioma del documento no se admite, se devuelve una advertencia y no se extrae ninguna entidad.

Consulte también