Habilidade cognitiva de Vinculação de Entidade (v3)

A habilidade Vinculação de Entidade (v3) retorna uma lista de entidades reconhecidas com links para artigos em uma base de dados de conhecimento bem conhecida (Wikipedia).

Observação

Essa habilidade está vinculada aos modelos de aprendizado de máquina da Vinculação de Entidade nos Serviços Cognitivos do Azure para Linguagem e requer um recurso faturável para transações que excedam 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pago conforme o uso dos serviços de IA do Azure existentes.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limites de dados

O tamanho máximo de um registro deve ser de 50.000 caracteres conforme medido por String.Length. Caso precise dividir seus dados antes de enviá-los para a habilidade EntityLinking, considere o uso da habilidade de Divisão de Texto. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.

Parâmetros de habilidades

Os nomes de parâmetros diferenciam maiúsculas de minúsculas e são todos opcionais.

Nome do parâmetro Descrição
defaultLanguageCode Código de idioma do texto de entrada. Se o código de idioma padrão não for especificado, em inglês (en) será usado como o código de idioma padrão.
Consulte a Lista completa dos idiomas com suporte.
minimumPrecision Um valor entre 0 e 1. Se a pontuação de confiança (na saída entities) for menor do que esse valor, a entidade não será retornada. O padrão é 0.
modelVersion (Opcional) Especifica a versão do modelo a ser usada ao chamar a vinculação de entidade. O padrão será o mais recente disponível quando não for especificado. Recomendamos que você não especifique esse valor, a menos que seja necessário.

Entradas de habilidades

Nome de entrada Descrição
languageCode Uma cadeia de caracteres que indica o idioma dos registros. Se esse parâmetro não for especificado, o código de idioma padrão será usado para analisar os registros.
Consulte a Lista completa dos idiomas com suporte.
text O texto para analisar.

Saídas de habilidades

Nome de saída Descrição
entities Uma matriz de tipos complexos que contêm os seguintes campos:
  • "name" (O nome real da entidade como é exibido no texto)
  • "id"
  • "language" (O idioma do texto, conforme determinado pela habilidade)
  • "url" (A URL vinculada a essa entidade)
  • "bingId" (A bingId para essa entidade vinculada)
  • "dataSource" (A fonte de dados associada à URL)
  • "matches" (Uma matriz de tipos complexos que contém: text, offset, length e confidenceScore)

Definição de exemplo

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Entrada de exemplo

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Saída de exemplo

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Os deslocamentos retornados para entidades na saída dessa habilidade são retornados diretamente das APIs do Serviço de Linguagem, o que significa que, se você os estiver usando para indexar na cadeia de caracteres original, deverá usar a classe StringInfo no .NET para extrair o conteúdo correto. Para saber mais, confira Suporte multilíngue e para emoji nos recursos do Serviço de Linguagem.

Casos de aviso

Se o código do idioma do documento não for suportado, um aviso será retornado e nenhuma entidade será extraída.

Confira também