Compartilhar via


Planejar propriedades de metadados para pesquisa (Search Server 2010)

 

Tópico modificado em: 2011-04-25

Este artigo descreve como planejar as propriedades de metadados para pesquisa no Microsoft Search Server 2010. Quando o conteúdo é rastreado, o rastreador também rastreia os metadados associados a esse conteúdo, por exemplo, informações como autor, título e endereço de email. O sistema de pesquisa armazena essas informações como propriedades rastreadas e propriedades gerenciadas. As propriedades rastreadas são todas as propriedades (como autor, título ou assunto) extraídas de documentos durante os rastreamentos. As propriedades gerenciadas são propriedades rastreadas que podem aparecer em pesquisas refinadas ou avançadas. Quando os usuários fazem uma pesquisa geral, os resultados incluem itens com todas as propriedades rastreadas. Para oferecer recursos de pesquisa refinada aos usuários, no entanto, é necessário planejar as propriedades gerenciadas. Como elas podem aparecer nas pesquisas refinadas, as propriedades gerenciadas ajudam os usuários a fazer consultas mais relevantes e bem-sucedidas. O Search Server 2010 dispõe de um conjunto padrão de propriedades gerenciadas, mas você pode criar novas propriedades gerenciadas e mapear as propriedades rastreadas para as propriedades gerenciadas que aparecem nos resultados da pesquisa.

Só é possível fazer pesquisas refinadas em propriedades gerenciadas, e não em propriedades rastreadas. Para disponibilizar uma propriedade rastreada a consultas de pesquisa refinadas, mapeie a propriedade rastreada para uma propriedade gerenciada. É possível mapear várias propriedades rastreadas para uma única propriedade gerenciada ou mapear uma única propriedade rastreada para várias propriedades gerenciadas. Se uma propriedade gerenciada tiver várias propriedades rastreadas mapeadas a ela, e um documento incluir valores referentes a mais de uma das propriedades rastreadas, a ordem na qual as propriedades serão mapeadas e sua prioridade determinarão o valor da propriedade gerenciada.

Por exemplo, três tipos diferentes de documentos podem ter nomes distintos para a propriedade que identifica o autor. Um tipo de documento pode chamar essa propriedade de Autor, outro de Escritor e um terceiro de Propriedade3. Embora todos os três sejam propriedades rastreadas, apenas os documentos que têm a propriedade Autor aparecerão nos resultados da pesquisa quando o usuário consultar por autor (por exemplo, digitando autor:John Smith na caixa de pesquisa). Para garantir que os documentos que têm os outros nomes de propriedades apareçam nos resultados da pesquisa refinada, mapeie cada uma dessas propriedades rastreadas para a propriedade gerenciada Autor.

Neste artigo:


  • Sobre propriedades gerenciadas


  • Reduzindo propriedades gerenciadas duplicadas


  • Adicionando propriedades de conceitos importantes à arquitetura da informação


  • Cenário

Sobre propriedades gerenciadas

Para criar um conjunto útil de propriedades gerenciadas, analise o conteúdo mais importante para encontrar metadados no conteúdo que você possa mapear para as propriedades gerenciadas.

É difícil descobrir propriedades de conteúdo sem primeiro rastrear o conteúdo. Portanto, é recomendável parar para planejar as propriedades gerenciadas até saber qual conteúdo está em cada conjunto de sites. Em seguida, é possível rastrear todo esse conteúdo usando um servidor de teste. Após o rastreamento, você terá uma lista das propriedades rastreadas para comparar com a arquitetura da informação ao criar as propriedades gerenciadas. Pode ser difícil mapear as propriedades mesmo após os rastreamentos do sistema, pois é difícil identificar o tipo de conteúdo ou o aplicativo que utiliza a propriedade. Se você não estiver certo sobre determinada propriedade, convém configurar um mapeamento em um ambiente de teste e fazer uma experiência com pesquisas relacionadas a essa propriedade.

Muitas das propriedades gerenciadas mais úteis são automaticamente criadas quando o Search Server 2010 é instalado. Use essas propriedades gerenciadas como ponto de partida para planejar as outras propriedades gerenciadas. Veja a seguir as propriedades que são automaticamente criadas:

  • Autor

  • Descrição

  • Nome do Site

  • Tipo

  • Tamanho do Arquivo

  • Data da Última Modificação

  • URL

  • Título

Lembre-se de que para fazer uma pesquisa eficiente usando propriedades, as propriedades rastreadas devem primeiro receber valores. Por exemplo, se você tem um documento do Microsoft Word 2010 com a propriedade Autor (que mapeia para uma propriedade gerenciada denominada Autor) e nenhum valor for atribuído à propriedade Autor nesse documento, o documento não será exibido nos resultados da pesquisa quando os usuários consultarem utilizando a propriedade Autor. Para garantir os melhores resultados nas pesquisas refinadas, considere implementar uma solução de gerenciamento de conteúdo corporativo que inclua o planejamento de metadados de documentos. Para obter mais informações sobre o planejamento de metadados de documentos, consulte Planejar metadados gerenciados (SharePoint Server 2010) e Planejar tipos de conteúdo e fluxos de trabalho (SharePoint Server 2010). Para obter mais informações sobre como planejar uma solução de gerenciamento de conteúdo corporativo, consulte Planejamento do gerenciamento de conteúdo corporativo (SharePoint Server 2010).

Para obter informações sobre como gerenciar propriedades de metadados, consulte Manage metadata properties for search (Search Server 2010)

Reduzindo propriedades gerenciadas duplicadas

Algumas propriedades básicas podem aparecer como propriedades rastreadas diferentes em diversos tipos de conteúdo. Por exemplo, as propriedades rastreadas podem ser Proprietário, Escritor e Criado por, todas como sinônimos de Autor. O mais importante a se fazer aqui é planejar uma redução de duplicatas, ou seja, criar um conjunto de propriedades gerenciadas e mapear as propriedades rastreadas que tenham o mesmo significado para as propriedades gerenciadas. Nesse caso, você mapeia Proprietário, Escritor e Criado por para a propriedade gerenciada Autor.

É possível priorizar várias propriedades rastreadas, assim se mais de uma propriedade for encontrada durante o rastreamento, apenas o valor da propriedade com prioridade mais elevada será usado nas consultas que utilizam a propriedade (ou propriedades) gerenciada. Se você não priorizar as propriedades rastreadas, os valores de todas as propriedades rastreadas mapeadas para a propriedade gerenciada serão utilizados nas consultas. Dessa forma, a propriedade gerenciada torna-se uma propriedade de múltiplos valores. Isso quer dizer que uma consulta retorna resultados referentes a todo o conteúdo que inclua os valores de qualquer uma das propriedades mapeadas correspondentes à consulta. A abordagem adequada para a propriedade de valor único é escolher a propriedade rastreada mais comum como a propriedade gerenciada e, em seguida, priorizar as propriedades mapeadas de acordo com a frequência em que elas ocorrem. Nem sempre é fácil determinar qual propriedade é rastreada com mais frequência, mas uma estratégia é priorizar as propriedades que você sabe que estão associadas a aplicativos frequentemente utilizados. Por exemplo, os documentos do O Microsoft Office 2010 incluem um conjunto padrão de propriedades, como Autor, Título, Empresa, Tipo e outros. Se a maioria dos usuários utilizar o O Microsoft Office 2010 e seu conjunto de conteúdo também incluir documentos criados em outros aplicativos, considere mapear as propriedades dos documentos que foram criados em outros aplicativos para as propriedades nos documentos do Office 2010. Se um documento criado em outro aplicativo incluir uma propriedade chamada Escritor, considere mapeá-la para a propriedade gerenciada denominada Autor.

Tenha cuidado no mapeamento de propriedades para não mapear propriedades irrelevantes ou que não sejam muito correspondentes, pois mapeamentos imprecisos podem reduzir a relevância dos resultados da pesquisa. Por exemplo, o mapeamento de uma propriedade chamada Salvo por último por para a propriedade gerenciada denominada Autor pode apresentar resultados de pesquisa menos relevantes. Se possível, faça um teste das pesquisas com propriedades gerenciadas antes da implantação inicial e revise os dados de uso das consultas de pesquisa durante as operações normais para ajustar as propriedades que você mapeou. Para obter mais informações sobre como revisar os dados de uso nas consultas de pesquisa, consulte Exibir relatórios do Web Analytics (SharePoint Server 2010).

Adicionando propriedades de conceitos importantes à arquitetura da informação

Além das propriedades rastreadas que são mapeadas para as propriedades gerenciadas por padrão, outras propriedades rastreadas podem ser mapeadas claramente para conceitos na arquitetura da informação que são capturados por propriedades gerenciadas existentes. Por exemplo, uma organização identifica o serviço de atendimento ao consumidor como um processo corporativo importante em sua arquitetura da informação. Conceitos importantes associados ao serviço de atendimento ao consumidor na arquitetura da informação podem incluir clientes, representantes do serviço de atendimento ao consumidor e regiões do serviço de atendimento ao consumidor.

Para cada conceito na arquitetura da informação, pergunte-se se há uma propriedade rastreada representando esse conceito que possa ser mapeada para uma propriedade gerenciada. Se houver, transforme-a em uma propriedade gerenciada.

Cenário

Um aplicativo de linha de negócios acompanha os dados do cliente e do funcionário, e as propriedades desses dados provavelmente serão candidatas a propriedades gerenciadas depois que forem registradas no Catálogo de Dados Corporativos e rastreadas como parte da fonte de conteúdo de dados corporativos. É possível também que você encontre propriedades rastreadas em aplicativos que devam ser mapeadas para essas propriedades gerenciadas; por exemplo, uma propriedade Identificador (ID) do representante do serviço de atendimento ao consumidor em um aplicativo de dados separado ou uma propriedade Autor de um tipo de aplicativo que é usada exclusivamente por representantes do serviço de atendimento ao consumidor. Uma consulta de pesquisa que utiliza essa propriedade ou um termo associado a essa propriedade inclui resultados de pesquisa para todos os itens que têm qualquer uma das propriedades rastreadas mapeadas para a propriedade gerenciada ID do representante do serviço de atendimento ao consumidor.

Cada processo corporativo principal identificado na arquitetura da informação tem um conjunto de tipos de arquivo associados ou aplicativos de dados corporativos que podem ser usados para descobrir possíveis propriedades gerenciadas.

Veja que, embora muitos conceitos na arquitetura da informação não sejam representados por propriedades, esses conceitos são úteis no planejamento da estrutura do site e na implementação de outros recursos de pesquisa. A arquitetura da informação identifica propriedades gerenciadas que você não percebeu. Porém, o fato de um conceito estar listado na arquitetura da informação não quer dizer que ele tenha uma propriedade gerenciada.