O que é a classificação semântica?

Concluído

A classificação semântica é um recurso da Pesquisa de IA do Azure que visa melhorar a classificação dos resultados da pesquisa. A classificação semântica melhora a classificação dos resultados da pesquisa usando o reconhecimento de linguagem para corresponder com mais precisão ao contexto da consulta original.

Funções de classificação BM25

A Pesquisa de IA do Azure usa a função de classificação BM25, por padrão. A função de classificação BM25 classifica os resultados da pesquisa com base na frequência com que o termo de pesquisa aparece em um documento. A função de classificação BM25 geralmente alcança excelentes resultados de classificação, porque um documento que frequentemente inclui um termo de pesquisa é muitas vezes o mais relevante, no entanto, esse nem sempre é o caso. A classificação BM25 não coloca qualquer relevância na semântica da consulta e a classificação às vezes pode ser melhorada adicionando o reconhecimento de linguagem.

Classificação semântica

A classificação semântica tem duas funções: ela melhora a classificação dos resultados da consulta com base no reconhecimento de linguagem e melhora a resposta à consulta fornecendo legendas e respostas nos resultados.

A classificação semântica usa a classificação BM25 e calcula uma nova pontuação de relevância usando a classificação BM25 original combinada com modelos de reconhecimento de linguagem para extrair o contexto e o significado da consulta.

Respostas e legendas semânticas

As respostas e legendas semânticas fornecem resultados adicionais junto com os resultados da pesquisa classificados que você pode exibir para melhorar a compreensão dos resultados para os usuários.

As legendas semânticas extraem frases resumidas do documento palavra por palavra e realçam o texto mais relevante nas frases resumidas.

Respostas semânticas é um recurso adicional opcional da classificação semântica que fornece respostas a perguntas. Se a consulta de pesquisa parecer ser uma pergunta e os resultados da pesquisa contiverem texto que pareça ser uma resposta relevante, a resposta semântica será retornada.

Como funciona a classificação semântica

A classificação semântica obtém os 50 melhores resultados a partir dos resultados da classificação BM25. Os resultados são divididos em vários campos, conforme definido por uma configuração semântica. Os campos são convertidos em cadeias de caracteres de texto e reduzidos em 256 tokens exclusivos. Um token é aproximadamente equivalente a uma palavra no documento.

Depois que as cadeias de caracteres são preparadas, elas são passadas para modelos de compreensão de leitura de computador para encontrar as frases e sentenças que melhor correspondem à consulta. O resultado dessa frase de resumo é uma legenda semântica e, opcionalmente, uma resposta semântica.

As legendas semânticas agora são classificadas com base na relevância semântica da legenda. Os resultados são então retornados em ordem decrescente de relevância.

Recursos de classificação semântica

Veja o vídeo a seguir para obter uma visão geral dos recursos da Pesquisa de IA:

Vantagens da classificação semântica

A classificação semântica tem duas vantagens principais em relação aos resultados da pesquisa tradicionais:

  • A classificação semântica pode classificar os resultados para corresponder mais à semântica da consulta original. Isso pode tornar mais provável que os documentos mais úteis apareçam na parte superior dos resultados da pesquisa.
  • A classificação semântica pode encontrar cadeias de caracteres dentro dos resultados para renderizar como uma legenda na página de resultados da pesquisa e fornecer uma resposta a uma pergunta.

Limitações de classificação semântica

A classificação semântica é aplicada aos resultados retornados da função de classificação BM25. Embora a classificação semântica possa classificar novamente os resultados fornecidos pela função de classificação BM25, ela não fornecerá nenhum documento adicional que não tenha sido retornado pela função de classificação BM25.

A classificação semântica usa os 50 melhores resultados da função de classificação BM25. Se mais de 50 resultados forem retornados, apenas os 50 melhores resultados serão considerados.

Preços da classificação semântica

Até 1000 consultas de classificação semântica por mês estão disponíveis gratuitamente.

Para mais de 1.000 consultas por mês, você deve escolher o preço standard. O custo do preço standard é baseado no volume de pesquisas, no tipo de pesquisas e na região da pesquisa.

Para obter mais informações sobre preços de classificação semântica, consulte Preços da Pesquisa de IA do Azure