Partilhar via


Visão geral da arquitetura de pesquisa no SharePoint Server

APLICA-SE A:yes-img-132013 yes-img-16 2016yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

A arquitetura de pesquisa contém componentes e bancos de dados de pesquisa. A maneira com que você estrutura a arquitetura de pesquisa depende de onde você pretende usar a pesquisa: para a empresa ou para sites da Internet. Ao criar a arquitetura de pesquisa, você deve levar em consideração questões como alta disponibilidade e tolerância a falhas, volume do seu conteúdo e a quantia estimada de visualizações de página e consultas por segundo.

Para obter mais informações sobre topologias de pesquisa para diferentes casos de uso, confira os diagramas técnicos Arquiteturas de pesquisa empresarial para o SharePoint Server 2016 e Arquiteturas de pesquisa de sites para o SharePoint Server 2016.

Visão geral de componentes de pesquisa e bancos de dados de pesquisa

As tabelas a seguir mostram uma visão geral de todos os componentes e bancos de dados de pesquisa disponíveis. Para obter mais informações sobre como os componentes e os bancos de dados de pesquisa interagem, confira o diagrama técnico Arquiteturas de pesquisa para o SharePoint Server 2016.

Componentes de pesquisa

Nome de componente de pesquisa Descrição
Componente de rastreamento Rastreia fontes de conteúdo para coletar propriedades rastreadas e metadados dos itens rastreados e envia essas informações ao componente de processamento de conteúdo.
Componente de processamento de conteúdo Transforma os itens rastreados e os envia ao componente de índice. Esse componente também mapeia propriedades rastreadas para propriedades gerenciadas.
Componente de processamento de análise Realiza análises de pesquisa e análise de uso.
Componente de índice Recebe os itens processados do componente de processamento de conteúdo e os grava no índice de pesquisa. Esse componente também trata de consultas de entrada, recupera informações do índice de pesquisa e envia o conjunto de resultados de volta para o componente do processamento de consulta.
Componente do processamento de consulta Analisa as consultas de entrada. Isso ajuda a otimizar a precisão, o retorno e a relevância. As consultas são enviadas ao componente de índice, que retorna um conjunto de resultados de pesquisa para a consulta.
Componente de administração de pesquisa Executa os processos do sistema para pesquisa e adiciona e inicializa novas instâncias de componentes de pesquisa.

Bancos de dados de pesquisa

Nome do banco de dados de pesquisa Descrição
Banco de dados de rastreamento Armazena informações de rastreamento e informações de histórico sobre itens rastreados, como documentos e URLs. Também armazena informações como o último tempo de rastreamento, a última ID de rastreamento e o tipo de atualização (adicionar, atualizar, excluir) durante o último rastreamento.
Banco de dados de link Armazena informações não processadas que são extraídas pelo componente de processamento de conteúdo, bem como as informações sobre os cliques de pesquisa. O componente de processamento de análise analisa essas informações.
Componente de processamento de análise Armazena os resultados de análise de uso.
Banco de dados de administração de pesquisa Armazena os dados de configuração de pesquisa.

Sobre o componente de rastreamento

O componente de rastreamento rastreia as fontes de conteúdo. Você pode rastrear uma grande variedade de fontes de conteúdo, como compartilhamentos de arquivo, conteúdo do SharePoint Server, linha de aplicativos de negócios e muito mais. Para recuperar informações, o componente de rastreamento se conecta às fontes de conteúdo através da invocação do conector de indexação ou do manipulador de protocolo apropriado. Depois de recuperar o conteúdo, o componente de rastreamento transmite itens rastreados ao componente de processamento de conteúdo.

Para mais informações sobre o rastreamento, de fontes de conteúdo, confira Planejar o rastreamento e a federação no SharePoint Server.

Sobre o componente de processamento de conteúdo

O componente de processamento de conteúdo processa itens rastreados e envia esses itens para o componente de índice. O componente de processamento de conteúdo executa operações como análise de documentos e mapeamento de propriedades. Ele também executa o processamento linguístico, como detecção de idioma e extração de entidade. O componente transforma itens rastreados em artefatos incluídos no índice de pesquisa. O componente de processamento de conteúdo também grava informações sobre links e URLs no banco de dados de link.

Para mais informações sobre o rastreamento de conteúdo, confira Planejar o rastreamento e a federação no SharePoint Server.

Sobre o componente de processamento de análise

O componente de processamento analítico executa dois tipos de análises: análise de pesquisa e análise de utilização. Esse componente usa informações dessas análises para aumentar a relevância da pesquisa, criar relatórios de pesquisa e gerar recomendações e links profundos.

  • A análise de pesquisa diz respeito à extração de informações, como links, o número de vezes que um item é clicado, texto âncora, dados relacionados a pessoas e metadados, do banco de dados de links. Essas informações são importantes para a relevância.

  • A análise de uso diz respeito à análise do uso da informações de log recebidas do front-end por meio do repositório de eventos. A análise de uso gera relatórios de uso e de análise.

Os resultados das análises são adicionados aos itens no índice de pesquisa. Além disso, os resultados da análise de uso são armazenados no banco de dados de relatórios de análise.

Para mais informações, confira Visão geral do processamento de análise no SharePoint Server.

Sobre o componente de índice

Você pode dividir o índice de pesquisa em porções discretas, chamadas partições de índice. O índice de pesquisa é a agregação de todas as partições de índice. Cada partição de índice retém uma ou mais réplicas de índice contendo as mesmas informações. Para conquistar a redundância e tolerância a falha, crie replicas de índice adicionais para cada partição do índice e distribua as réplicas de índice entre vários servidores.

O componente de índice é a representação lógica de uma réplica do índice. Na topologia de pesquisa, você tem que fornecer um componente de índice para cada réplica de índice.

O componente de índice:

  • Recebe os itens processados do componente de processamento de conteúdo e os grava em um arquivo de índice. Os arquivos de índice são armazenados em um disco no servidor que hospeda o componente do índice.

  • Recebe consultas do componente de processamento de consulta e retorna os conjuntos de resultados.

Para obter mais informações sobre o esquema de pesquisa e o índice de pesquisa, confira Visão geral do esquema de pesquisa no SharePoint Server.

Sobre o componente de processamento de consulta

O componente de consulta analisa e processa consultas e resultados. Ele realiza processamentos linguísticos como quebra de palavras e lematização. Quando o componente de processamento de consulta recebe uma consulta do front-end de pesquisa, ele a analisa e a processa para otimizar a precisão, o retorno e a relevância. A consulta processada é submetida ao componente de índice. O componente de índice retorna um conjunto de resultado baseado na consulta processada ao componente de processamento de consulta, o qual, por sua vez, processa esse conjunto de resultado antes de retorná-lo ao front-end.

Para mais informações, confira Planejar a transformação de resultados de consulta e de ordenação no SharePoint Server.

Sobre o componente de administração de pesquisa

O componente de administração de pesquisa executa os processos do sistema para pesquisa. Esse componente realiza o provisionamento, o qual adiciona e inicializa instâncias dos outros componentes de pesquisa.

Sobre o banco de dados de rastreamento

O banco de dados de rastreamento armazena as informações de rastreamento e detalhes sobre itens rastreados. Por exemplo, ele armazena informações sobre o último tempo de rastreamento, a última ID de rastreamento e o tipo de atualização durante o último rastreamento.

O banco de dados de link armazena informações extraídas pelo componente de processamento de conteúdo. Também armazena informações sobre o número de vezes que as pessoas clicaram em um resultado da página de resultados de pesquisa. A informação é armazenada sem ter sido processada, para ser analisada pelo componente de processamento de análise.

Sobre o banco de dados do relatório de análise

O banco de dados de relatório de análise armazena os resultados de análise de uso. Além disso, ele armazena informações estatísticas da análise. O SharePoint Server usa essas informações para criar relatórios do Excel mostrando diferentes estatísticas.

Sobre o banco de dados da administração de pesquisa

O banco de dados da administração de pesquisa armazena os dados de configuração de pesquisa, como a topologia, regras de rastreamento e os mapeamentos entre propriedades rastreadas e gerenciadas. Ele também armazena a lista de controle de acesso (ACL) para o componente de rastreamento. Só pode existir um banco de dados de administração de pesquisa por aplicativo de serviço de pesquisa.

Confira também

Gerenciar a topologia de pesquisa no SharePoint Server