Partilhar via


Pesquisa Semântica (SQL Server)

Aplica-se a:SQL Server

A Pesquisa Semântica Estatística fornece uma visão profunda sobre documentos não estruturados armazenados em bases de dados SQL Server, extraindo e indexando frases-chave estatisticamente relevantes. Depois, utiliza estas frases-chave para identificar e indexar documentos semelhantes ou relacionados.

O que se pode fazer com a Pesquisa Semântica?

A pesquisa semântica baseia-se na funcionalidade existente de pesquisa em texto completo no SQL Server, mas permite novos cenários que vão além das pesquisas por palavras-chave. Enquanto a pesquisa em texto completo permite consultar as palavras de um documento, a pesquisa semântica permite consultar o significado do documento. As soluções agora possíveis incluem extração automática de etiquetas, descoberta de conteúdos relacionados e navegação hierárquica entre conteúdos semelhantes. Por exemplo, pode consultar o índice de frases-chave para construir a taxonomia de uma organização, ou para um corpus de documentos. Ou pode consultar o índice de similaridade de documentos para identificar currículos que correspondam a uma descrição de cargo.

Os exemplos seguintes demonstram as capacidades da Pesquisa Semântica. Ao mesmo tempo, estes exemplos demonstram as três Transact-SQL funções de conjunto de linhas que se usam para consultar os índices semânticos e recuperar os resultados como dados estruturados.

Encontre as palavras-chave num documento

A consulta seguinte apresenta as frases-chave identificadas no documento de exemplo. Apresenta os resultados por ordem decrescente pela pontuação que classifica a significância estatística de cada frase-chave.

Esta consulta chama a função semantickeyphrasetable .

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC  
  

Encontre documentos semelhantes ou relacionados

A consulta seguinte obtém os documentos que foram identificados como semelhantes ou relacionados com o documento de exemplo. Apresenta os resultados por ordem decrescente pela pontuação que classifica a semelhança dos dois documentos.

Esta consulta invoca a função semanticsimilaritytable.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC  
  

Encontre as palavras-chave que tornam os documentos semelhantes ou relacionados

A consulta seguinte apresenta as frases-chave que tornam os dois documentos de exemplo semelhantes ou relacionados entre si. Apresenta os resultados por ordem decrescente pela pontuação que classifica o peso de cada palavra-chave.

Esta consulta chama a função semanticsimilaritydetailstable.

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC  
  

Armazene os seus documentos no SQL Server

Antes de poderes indexar documentos com a Pesquisa Semântica, tens de os armazenar numa base de dados SQL Server.

A funcionalidade FileTable no SQL Server torna os ficheiros e documentos não estruturados cidadãos de primeira classe da base de dados relacional. Como resultado, os programadores de bases de dados podem manipular documentos juntamente com dados estruturados em Transact-SQL operações baseadas em conjuntos.

Para mais informações sobre a funcionalidade FileTable, consulte FileTables (SQL Server). Para informações sobre a funcionalidade FILESTREAM, que é outra opção para armazenar documentos na base de dados, consulte FILESTREAM (SQL Server).

Tarefas relacionadas

Instalar e Configurar a Pesquisa Semântica
Descreve os pré-requisitos para a pesquisa semântica estatística e como os instalar ou verificar.

Ativar a pesquisa semântica em tabelas e colunas
Descreve como habilitar ou desabilitar a indexação semântica estatística em colunas selecionadas que contêm documentos ou texto.

Encontre Frases-Chave em Documentos com Pesquisa Semântica
Descreve como encontrar as frases-chave em documentos ou colunas de texto configuradas para indexação semântica estatística.

Encontre Documentos Semelhantes e Relacionados com Pesquisa Semântica
Descreve como encontrar documentos ou valores de texto semelhantes ou relacionados, e informações sobre como são semelhantes ou relacionados, em colunas configuradas para indexação semântica estatística.

Gerir e Monitorizar a Pesquisa Semântica
Descreve o processo de indexação semântica e as tarefas relacionadas com a monitorização e gestão dos índices.

Conteúdo relacionado

DDL de pesquisa semântica, funções, procedimentos armazenados e vistas
Lista as instruções Transact-SQL e os objetos da base de dados SQL Server adicionados ou alterados para suportar pesquisa semântica estatística.