Habilidade cognitiva de vinculação de entidade (v3)

A habilidade de vinculação de entidades (v3) retorna uma lista de entidades reconhecidas com links para artigos em uma base de conhecimento bem conhecida (Wikipedia).

Nota

Essa habilidade está vinculada aos modelos de aprendizado de máquina de Vinculação de Entidade na Linguagem de IA do Azure e requer um recurso faturável para transações que excedam 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pré-pago dos serviços de IA do Azure existentes.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limites de dados

O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se você precisar dividir seus dados antes de enviá-los para a habilidade EntityLinking, considere usar a habilidade Divisão de texto. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.

Parâmetros de habilidade

Os nomes dos parâmetros diferenciam maiúsculas de minúsculas e são todos opcionais.

Nome do parâmetro Description
defaultLanguageCode Código linguístico do texto de entrada. Se o código de idioma padrão não for especificado, o inglês (en) será usado como o código de idioma padrão.
Veja a lista completa de linguagens suportadas.
minimumPrecision Um valor entre 0 e 1. Se a pontuação de confiança (na saída) for inferior a este valor, a entities entidade não é devolvida. A predefinição é 0.
modelVersion (Opcional) Especifica a versão do modelo a ser usada ao chamar a vinculação de entidade. O padrão será o mais recente disponível quando não especificado. Recomendamos que você não especifique esse valor, a menos que seja necessário.

Contributos para as competências

Nome de entrada Description
languageCode Uma cadeia de caracteres que indica o idioma dos registros. Se esse parâmetro não for especificado, o código de idioma padrão será usado para analisar os registros.
Veja a lista completa de linguagens suportadas.
text O texto a analisar.

Resultados em termos de competências

Nome da saída Description
entities Uma matriz de tipos complexos que contém os seguintes campos:
  • "name" (O nome real da entidade tal como aparece no texto)
  • "id"
  • "language" (A língua do texto determinada pela habilidade)
  • "url" (O url vinculado a esta entidade)
  • "bingId" (O bingId para esta entidade vinculada)
  • "dataSource" (A fonte de dados associada ao url)
  • "matches"(Uma matriz de tipos complexos que contém: text, , offsetlength e confidenceScore)

Definição da amostra

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Entrada de exemplo

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Saída de exemplo

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Os deslocamentos retornados para entidades na saída dessa habilidade são retornados diretamente das APIs do Serviço de Linguagem, o que significa que, se você estiver usando-os para indexar na cadeia de caracteres original, deverá usar a classe StringInfo no .NET para extrair o conteúdo correto. Para obter mais informações, consulte Suporte multilíngue e a emojis em Recursos do serviço de idiomas.

Casos de alerta

Se o código de idioma do documento não for suportado, um aviso será retornado e nenhuma entidade será extraída.

Consulte também