Partilhar via


Visão geral do esquema de pesquisa no SharePoint Server

APLICA-SE A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

O índice é o centro da pesquisa. O que está no índice de pesquisa determina o que pessoas encontram quando procuram informações inserindo consultas de pesquisa ou interagindo com páginas da Internet ou intranet.

Este artigo descreve como o conteúdo é coletado e recuperado do índice de pesquisa, usando o esquema de pesquisa. O esquema de pesquisa contém propriedades rastreadas, categorias de propriedades rastreadas, o mapeamento de propriedades rastreadas para as gerenciadas e as configurações das propriedades gerenciadas. Essas configurações definem o que e como você pode pesquisar, por exemplo, se você pode refinar ou consultar uma propriedade.

Rastreamento e propriedades rastreadas

Para construir o índice de pesquisa, você deve rastrear o conteúdo primeiro. Você pode rastrear várias fontes de conteúdo, por exemplo, conteúdo do SharePoint Server, compartilhamento de arquivos ou perfis de usuário. O conteúdo e os metadados dos itens rastreados são representados como propriedades rastreadas.

Cada item que foi rastreado e transferido para o componente de processamento de conteúdo possui propriedades rastreadas associadas. Os exemplos de propriedades são Autor, Título e Data de Criação. As novas propriedades rastreadas serão descobertas automaticamente.

Propriedades rastreadas são agrupadas em categorias baseadas no IFilter ou manipulador de protocolo do item. Exemplos de categorias são Escritório (propriedade rastreadas de documentos do Word, planilhas do Excel e assim por diante), Dados Corporativos (de bancos de dados de exemplo) e Web (de sites).

Para mais informações sobre o rastreamento, confira Planejar o rastreamento e a federação no SharePoint Server.

Propriedades gerenciadas e mapeamento de propriedade

Para incluir o conteúdo e os metadados de propriedades rastreadas no índice de pesquisa, você deve mapear as propriedades rastreadas para as propriedades gerenciadas. Apenas as propriedades gerenciadas são gravadas no índice de pesquisa.

As propriedades geridas podem ter muitas definições. As definições na propriedade gerida determinam como os conteúdos podem ser mostrados nos resultados da pesquisa e como as pessoas podem procurá-lo.

É possível mapear várias propriedades rastreadas para uma propriedade gerenciada. Por exemplo, você pode mapear as propriedades rastreadas "Escritor" e "Autor" para a propriedade gerenciada "Autor". Ou, é possível mapear uma propriedade rastreada para várias propriedades gerenciadas.

Além disso, a ordem na qual propriedades rastreadas são mapeadas a uma propriedade gerenciada pode determinar o conteúdo de uma propriedade gerenciada. Por exemplo, uma propriedade gerenciada pode ter várias propriedades rastreadas mapeadas a ela, e pode ser definida para incluir todos os valores de todas as propriedades rastreadas mapeadas a ela. Porém, se você der prioridade à propriedade rastreada que contém o título SharePoint sobre outro título no mapeamento, ela mostrará o título do SharePoint nos resultados da pesquisa.

Um conjunto de mapeamentos padrão entre as propriedades rastreadas e gerenciadas foi definido, confira Visão geral das propriedades rastreadas e gerenciadas no SharePoint Server.

Alguns tipos de propriedade rastreada geram automaticamente uma nova propriedade gerenciada, e um mapeamento entre a propriedade rastreada e a gerenciada. Por exemplo, todas as colunas de site das bibliotecas do SharePoint possuem essa geração e mapeamento automáticos. Quando você cria uma coluna de site em uma lista e rastreia essa lista, uma propriedade rastreada e uma gerenciada, e um mapeamento entre ambas, são criados automaticamente para a coluna.

Você pode alterar o mapeamento padrão e qualquer outro mapeamento das propriedades rastreadas para as gerenciadas, criar novos mapeamentos ou criar novas propriedades gerenciadas. Quando você cria uma nova propriedade gerenciada, ouquando altera certas configurações em propriedades gerenciadas existentes, um rastreamento completo deve ser feito antes que a propriedade gerenciada e seu valor sejam incluídos no índice de pesquisa. Se a propriedade nova ou alterada estiver em uma biblioteca ou lista do SharePoint, você pode reindexar essa biblioteca ou lista individual sem iniciar um rastreamento completo da fonte de conteúdo inteira do SharePoint. Isso tem o mesmo efeito de um rastreamento completo.

Confira a tabela Visão geral das configurações de propriedades gerenciadas posteriormente neste artigo para obter mais informações.

O esquema de pesquisa

O esquema de pesquisa é armazenado no banco de dados de Administração de Pesquisa. Ele contém:

  • O mapeamento entre propriedades rastreadas e propriedades gerenciadas. Pode ser um mapeamento de uma propriedades rastreada para uma propriedade gerenciada, de uma para várias, várias para uma ou até várias para várias.

  • Como as propriedades gerenciadas devem ser gravadas no índice de pesquisa. Por exemplo, em qual índice de texto completo os valores das propriedades gerenciadas devem ser gravados e em qual grupo de ponderação (contexto).

  • As configurações das propriedades gerenciadas diferentes. Por exemplo, se você pode pesquisar, consultar ou refinar os resultados da pesquisa através de propriedades gerenciadas específicas.

  • Categorias de propriedade rastreada que agrupam propriedades de acordo com o respectivo IFilter ou manipulador de protocolo. Se você edcitar uma categoria de propriedade rastreada, suas alterações serão aplicadas a todas as propriedades rastreadas na categoria. Isso pode influenciar o desempenho e o modo como itens são salvos no índice de pesquisa.

As atualizações do esquema de pesquisa são propagadas pelo sistema de pesquisa a cada minuto.

Vários esquemas de pesquisas

Você pode criar vários esquemas de pesquisa. O esquema de pesquisa principal é definido no aplicativo de serviço Pesquisa e pode ser editado na Administração Central. Os administradores de locatários e de conjuntos de sites podem alterar o esquema de pesquisa para um locatário ou conjunto de sites específico. Por exemplo, um administrador de conjunto de sites pode personalizar o que é incluído no índice de pesquisa ao alterar o esquema de pesquisa para aquele conjunto de sites. Os proprietários do site podem ver o esquema de pesquisa, mas não alterá-lo.

Observação

[!OBSERVAçãO] Você não pode ver ou alterar o esquema de pesquisa do conjunto de sites no Administração Central. Para ver ou alterar o esquema de pesquisa para um conjunto de sites, é necessário usar a Administração do Conjunto de Sites.

O índice de pesquisa

O índice de pesquisa consiste em um conjunto de arquivos nas pastas de um servidor. O componente de processamento do conteúdo processa os itens pesquisados, usa o esquema de pesquisa para mapear as propriedades rastreadas para as gerenciadas e converte as propriedades gerenciadas em um formato gravado no índice de pesquisa. Além de vários índices de texto completo, existem índices separados de propriedades gerenciadas marcadas como recuperáveis e outros marcados como consultáveis. Também existe um índice separado para os vetores de atributo e existem índices numéricos.

Grupos de atualização de índice

Sempre que o item muda, ele deve ser reindexado depois que foi rastreado novamente. Para reduzir a carga da reindexação, o SharePoint Server introduz vários grupos de atualização de índices separados.

  • Padrão Contém a maioria de propriedades gerenciadas. Esse grupo contém todas as propriedades gerenciadas que não pertencem aos grupos Segurança, Link, Uso ou Pessoas.

  • Segurança Contém a propriedade gerenciada da lista de Controle de acesso (ACL) do documento

  • Link Contém as propriedades gerenciadas relacionadas à estrutura de link

  • Uso Contém as propriedades gerenciadas relacionadas aos dados de uso

  • Pessoas Contém as propriedades gerenciadas relacionadas às pesquisas de pessoas

Cada grupo de atualização é armazenado em uma pasta diferente no índice de pesquisa.

Índice de texto completo

Um índice de texto completo contém todo o texto das propriedades gerenciadas pesquisáveis, que são armazenados no índice de texto completo. Cada índice de texto completo é dividido em grupos de peso, também conhecido como contextos. Os diferentes contextos estão relacionados com a importância relativa de uma propriedade gerida, que é uma das funcionalidades de classificação utilizadas para calcular a classificação de relevância total de um resultado de pesquisa. O número ou ID de um contexto não é importante; o modelo de classificação determina sua importância relativa, atribuindo um peso contribuição a um contexto particular. O maior peso resulta em uma contribuição maior pontuação de classificação. Para obter mais informações, veja a seção sobre Influenciar a classificação de resultados de pesquisa usando o esquema de pesquisa no artigo de Visão geral do resultado de pesquisa de classificação no SharePoint Server.

Há dois índices de texto completo predefinidos: o índice de texto completo dos termos do SharePoint( SpTermsIdx ) e o índice de pessoas ( PeopleIdx ).

A maioria das propriedades gerenciadas já é mapeada para um índice de texto completo e contexto adequado por padrão. Não recomendamos a alteração do contexto de nenhuma das propriedades gerenciadas pesquisáveis existentes.

Visão geral das configurações da propriedade gerenciada

As configurações das propriedades gerenciadas determinam como o conteúdo é salvo no índice de pesquisa e se, e como, as pessoas podem pesquisar e recuperar a respeito.

O esquema de pesquisa pode ser editado na Administração Central, na Administração do Conjunto de Sites e na Administração de Locatários. Os administradores de site podem ver o esquema de pesquisa, mas não podem editá-lo. A tabela a seguir descreve as diferentes configurações e se elas estão disponíveis para a edição nos diferentes níveis do administrador.

Configuração da propriedade gerenciada Função Exemplo Disponível em Rastreamento completo ou reindexação da lista/biblioteca do SharePoint requerida após alteração da configuração
Pesquisável Permite consultar o conteúdo da propriedade gerenciada. Esse conteúdo é incluído no índice de texto completo. Se a propriedade for "autor", uma consulta simples "Smith" retorna os itens que contêm a palavra "Smith" e os itens cuja propriedade autor contém "Smith". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Configurações pesquisáveis avançadas Permite exibir e alterar o índice de texto completo no qual a propriedade gerenciada está gravada. Também permite alterar o contexto da propriedade gerenciada para o cálculo da classificação de relevância. Não recomendamos que o contexto de nenhuma das propriedades gerenciadas existentes seja alterado. Para obter mais informações, veja a seção sobre Influenciar a classificação de resultados de pesquisa usando o esquema de pesquisa no artigo de Visão geral do resultado de pesquisa de classificação no SharePoint Server. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Consultável Permite consultar a propriedade gerenciada específica. O nome da propriedade deve ser incluído na consulta, sendo especificado diretamente ou incluído de maneira programática. Se a propriedade gerenciada for "autor", a consulta deve conter "autor:Smith". Administração Central / Administração de Conjunto de Sites / Administração de Locatários De desabilitado para habilitado.
Recuperável Permite que o conteúdo dessa propriedade gerenciada seja retornado nos resultados da pesquisa. Ative essa configuração para as propriedades relevantes para a apresentação nos resultados da pesquisa. Administração Central/Administração de Conjunto de Sites/Administração de Locatários De desabilitado para habilitado.
Permitir valores múltiplos Permite diversos valores do mesmo tipo nessa propriedade gerenciada. Se a propriedade gerenciada for "autor" e um documento tem vários autores, o nome de cada autor será armazenado como um valor separado na propriedade. Administração Central Sim
Refinável Sim - ativo: Permite usar a propriedade como um refinador dos resultados de pesquisa no front-end. Configure o refinador manualmente no web part.

Sim - latente: permite trocar o refinável para ativo mais tarde, sem ter que fazer um rastreamento completo quando trocar.

As duas opções exigem um rastreamento completo para surtirem efeito.

IMPORTANTE: Se você selecionar Sim - ativo ou Sim - latente, também deverá tornar a propriedade gerenciada Consultável.

Não suportado na experiência de pesquisa moderna.
Se a propriedade "autor" for configurada como Refinável, você pode configurar Autor como um refinador em seu front-end de pesquisa mais tarde. Administração Central De desativado para ativado (se ainda não estiver definido para Ordenável)
Ordenável Sim - ativo: permite ordenar o conjunto de resultados com base na propriedade, antes que seja retornado.

Sim - latente: permite trocar o ordenável para ativo mais tarde, sem ter que fazer um rastreamento completo quando trocar.

As duas opções exigem um rastreamento completo para surtirem efeito.

Não suportado na experiência de pesquisa moderna.
Use para conjuntos de resultados grandes, que não podem ser ordenados e recuperados ao mesmo tempo. Administração Central De desativado para ativado (se ainda não estiver definido para Refinável)
Alias Define um alias para a propriedade gerenciada, se você deseja usá-lo em vez do nome da propriedade nas consultas e nos resultados da pesquisa. Use a propriedade gerenciada original e não o alias para mapear para uma propriedade rastreada. Use um alias se você não deseja ou não tem permissão para criar uma propriedade gerenciada nova. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Não
Normalização de Token Permite retornar resultados independentes da caixa alta/baixa e dos diacríticos usados na consulta. A consulta "curacao" também corresponderá a "Curaçao", "curacao" e "Curacao". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Correspondência Completa Por predefinição, a pesquisa devolve correspondências parciais entre consultas relativamente a uma propriedade gerida e ao conteúdo da propriedade gerida.

Selecione Correspondência Completa para procurar para devolver correspondências exatas.
Se uma propriedade gerida "Título" contiver "Sites Contoso", apenas o Título da consulta: "Sites Contoso" dará um resultado. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Tokenização neutra de linguagem (apenas no SharePoint Server 2019) Selecione a tokenização neutra em linguagem se tiver conteúdo multilingue e a propriedade gerida contiver etiquetas baseadas em conjuntos de termos de metadados ou outros identificadores.

Por predefinição, a pesquisa depende do idioma quando divide consultas e conteúdos em partes (tokenização). Por exemplo, uma biblioteca de documentos que contém folhas de dados de produtos em inglês e chinês em que os identificadores de produtos têm carateres não alfanuméricos, como "11.132-84-115#4". Quando a pesquisa processa uma folha de dados, deteta o respetivo idioma e tokens tudo o que contém de acordo com esse idioma. Quando os utilizadores procuram um identificador de produto, a pesquisa tokeniza a consulta de acordo com a definição de idioma do site do SharePoint em que se encontram. Se o site estiver definido como inglês e o utilizador procurar um identificador de produto que tenha sido token como texto chinês, os tokens poderão não corresponder e os utilizadores não obterão resultados.

Para melhorar os resultados para os utilizadores, mapeie a propriedade pesquisada do identificador do produto para uma nova propriedade gerida, "ProductID", com a tokenização neutra em linguagem ativada. Instrua os utilizadores a procurar identificadores de produtos relativamente à nova propriedade gerida, da seguinte forma: ProductID:"11.132-8".
Se a propriedade pesquisada de um identificador de produto estiver mapeada para uma propriedade gerida "ProductID", a pesquisa utilizará a tokenização neutra de idioma para consultas em relação a "ProductID". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Tokenização de consulta mais fina (apenas no SharePoint Server 2019) Utilize esta definição para ajudar os utilizadores a obter melhores resultados de pesquisa quando pesquisam em propriedades geridas que contêm metadados com carateres não alfanuméricos. Esta definição torna as consultas na propriedade gerida mais lentas.

Os utilizadores que preferem introduzir rapidamente uma consulta e, em seguida, procurar os resultados para encontrar a folha de dados que procuram, normalmente introduzem consultas como ProductID:"132-884". Uma vez que a pesquisa por predefinição divide o conteúdo do índice de pesquisa em partes mais pequenas do que as consultas, a pesquisa pode não encontrar correspondências para estas consultas. Quando a consulta é tokens mais fina, é mais provável que existam correspondências entre os tokens no índice de pesquisa e na consulta. Os utilizadores também podem consultar a parte central ou a última parte do identificador do produto.

Os utilizadores que procuram uma folha de dados e esperam obter apenas resultados que correspondam ao identificador completo do produto, normalmente escrevem consultas como ProductID:"11.132-884-115#4". Uma melhor tokenização de consulta não faz diferença para essas consultas.
Se tiver uma propriedade gerida "Identificador de produto" que contenha "11.132-884-115#4", pesquisas como ProductID:"132-884" provavelmente obterão resultados. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Não
Mapeamentos para propriedades rastreadas A lista mostra todas as propriedades rastreadas mapeadas para esta propriedade gerenciada. A propriedade gerenciada pode obter seu conteúdo de uma ou mais propriedades rastreadas.

Você pode incluir o conteúdo de todas as propriedades rastreadas ou da primeira propriedade rastreada que não seja vazia, com base em uma ordem específica.
Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Extração do nome de empresa Permite que o sistema extraia entidades de nome de empresa da propriedade gerenciada, ao rastrear itens novos ou atualizados. As entidades extraídas podem, mais tarde, ser usadas para definir refinadores.

Existe um dicionário pré-preenchido para a extração de nomes da empresa. O sistema guarda o conteúdo da propriedade gerida original inalterado no índice e, além disso, copia as entidades extraídas para a propriedade gerida "empresas". A propriedade gerida "empresas" está configurada para ser pesquisável, consultada, recuperável, ordenável e refinável.

Você pode editar o dicionário de nomes de empresa no Repositório de Termos.

Para obter mais informações, consulte Gerenciar extração do nome da empresa no SharePoint Server.

Não suportado na experiência de pesquisa moderna.
Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Extração da entidade personalizada Permite que um ou mais extratores de entidade personalizada sejam associados a esta propriedade gerenciada. Assim, o sistema pode extrair entidades da propriedade gerenciada quando rastrear itens novos ou atualizados. As entidades podem ser usadas, mais tarde, para configurar refinadores.

Para saber mais, confira Criar e implantar extratores de entidade personalizada no SharePoint Server.

Não suportado na experiência de pesquisa moderna.
Administração Central / Administração de Conjunto de Sites Sim

Confira também

Gerenciar o esquema de pesquisa no SharePoint Server

Visão geral dos rastreadas e propriedades gerenciadas no SharePoint Server

Planejar o rastreamento e a federação no SharePoint