Compartilhar via


Criar e implantar extratores de entidade personalizada no SharePoint Server

APLICA-SE A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

Você cria e mantém o arquivo extrator de entidade personalizada em um sistema externo ao SharePoint Server antes de importá-lo ao SharePoint Server para tornar o extrator de entidade personalizada disponível para o sistema de pesquisa.

Para utilizar entidades personalizadas como refinadores na pesquisa clássica, crie primeiro um dicionário de extração de entidades personalizadas e implemente-o. Em seguida, configura uma propriedade gerenciada para usar um extrator de entidade personalizada e executar um rastreamento completo. Após isso, é possível configurar o Web Part de Refinamento na página de resultados da pesquisa para usar a entidade personalizada como um refinador.

Antes de começar

Antes de iniciar esta operação, tem de ter em vigor:

  • Um aplicativo de serviço de pesquisa.

  • Uma ou mais fontes de conteúdo totalmente rastreadas.

  • Uma página de resultados de pesquisa

Criar um dicionário de extração de entidade personalizada

Para criar um dicionário de extração de entidade personalizada

  1. Determine qual tipo de dicionário de extração de entidade personalizada você deseja criar: Word, Word Part, Word exact ou Word Part exact. Consulte Visão geral dos tipos de extratores de entidade personalizada.

  2. Crie um arquivo .csv com as colunas Chave e Formulário de Exibição. Use uma vírgula como separador da coluna. Se o arquivo contém caracteres que não são ASCII, como diacríticos, você precisa codificá-lo em UTF-8. Guarde o ficheiro numa localização acessível a partir do servidor a partir do qual irá executar o cmdlet do Microsoft PowerShell para implementar o dicionário de extração de entidades personalizadas.

    • Na coluna Chave, insira o termo (uma ou várias palavras) que você deseja incluir como entidades personalizadas. É possível usar mais de uma linha por chave. Certifique-se de que não há espaços em branco ao redor dos termos.

    • (Opcional) Na coluna Formulário de exibição, insira um nome do refinador. Caso deixe essa coluna vazia, o termo extraído do conteúdo será exibido como o refinador no mesmo caso em que ocorra tal conteúdo. Utilize a coluna Display Form para controlar e padronizar a forma como o refinador é exibido.

Por exemplo, uma organização chamada Contoso possui um sistema de certificação de três níveis: Contoso Beginner, Contoso Professional e Contoso Expert. A Contoso deseja extrair essas entidades e deseja poder refinar todas. Independentemente do caso em que a palavra "Contoso", "beginner", "professional" ou "expert" esteja escrita, eles desejam exibir o refinador como Contoso Beginner, Contoso Professional e Contoso Expert. Para esse exemplo, a entrada do arquivo do dicionário de extração de identidade personalizada seria como segue:

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

Implantar um dicionário de extração de entidade personalizada

Para implantar o dicionário de extração de entidade personalizada, você deve importá-lo para o SharePoint Server.

Para importar um dicionário de extração de entidade personalizada

  1. Verifique se a conta do usuário importando o dicionário de extrator de entidade personalizada é administradora para o aplicativo de serviço de Pesquisa.

  2. Inicie o Shell de Gerenciamento do SharePoint.

  3. No prompt de comando do Windows PowerShell, digite o seguinte comando:

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    Em que:

    • <Path> especifica o caminho UNC completo do arquivo .csv (o dicionário de extração personalizado) a ser importado.

    • <Dictionary name> é o nome do tipo de dicionário de extração personalizada.

    Dependendo do tipo de dicionário que estiver importando, insira um dos seguintes:

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word. n [onde n = 1,2,3,4 ou 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart. n [no qual n = 1,2,3,4 ou 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

Configurar uma propriedade gerenciada para a extração de entidade personalizada

O procedimento a seguir descreve como associar o dicionário de extração de identidade personalizada com uma propriedade gerenciada existente o qual deseja extrair entidades personalizadas. Normalmente, essa propriedade gerenciada que você espera que contenha tais entidades, como as propriedades gerenciadas Título ou Corpo. As entidades personalizadas são extraídas do conteúdo completo da propriedade gerida à qual estão associadas, mesmo que as secções nesses conteúdos estejam marcadas como <sem índice>.

Para especificar de qual propriedade gerenciada as entidades personalizadas devem ser extraídas, edite a propriedade gerenciada existente. Para obter mais informações sobre a gestão de propriedades pesquisadas e geridas, veja Gerir o esquema de pesquisa no SharePoint Server.

Para editar uma propriedade gerenciada para extração de entidade personalizada

  1. Verifique se a conta do usuário é a de administrador no aplicativo de serviço de Pesquisa.

  2. Em Administração Central, na seção Gerenciamento de Aplicativos, clique em Gerenciar Aplicativos de Serviço.

  3. Clique no aplicativo de serviço de Pesquisa.

  4. Na página Administração da Pesquisa, em Inicialização Rápida, na seção Consultas e Resultados, clique em Esquema de Pesquisa.

  5. Na página Propriedades Gerenciadas, encontre a propriedade gerenciada que você quer associar ao dicionário de extração de entidade personalizada que contém as palavras únicas ou múltiplas (ou partes de palavra). Você também pode inserir o nome da propriedade gerenciada na caixa Filtro.

  6. Aponte para a propriedade gerenciada, clique na seta e clique em Editar/mapear propriedade.

  7. Na página Editar propriedade gerenciada, edite as configurações em Extração de entidade personalizada. Selecione o dicionário de extração de entidade personalizada importado e clique em OK.

Após a conclusão da próxima pesquisa completa, o extrator de entidades personalizado é ativado. O conteúdo da propriedade gerida original é guardado inalterado no índice de pesquisa. Além disso, dependendo do tipo de extrator de entidades personalizadas que ativou, as entidades extraídas são copiadas para uma ou mais das seguintes propriedades geridas:

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

Estas propriedades geridas são configuradas automaticamente para serem pesquisáveis, consultadas, recuperáveis, ordenáveis e refináveis.

Configurar um refinador no Web Part

É possível usar as entidades personalizadas extraídas como refinadores na página de resultados de pesquisa. Os refinadores baseados nas entidades personalizadas estão disponíveis no Web Part de Refinamento.

Para adicionar um refinador com base em um extrator de entidade personalizado

  1. Verifique se a conta do usuário que executa este procedimento é membro do grupo Designers do SharePoint no site do Enterprise Search Center.

  2. Navegue até a página que contém o web part de refinamento que você quer configurar, clique no menu Configurações e, em seguida, em Editar Página.

  3. Edite o Web Part de Refinamento. Clique na seta do menu de Web Part de refinamento e, em seguida, clique em Editar Web Part.

    • No painel de ferramentas do Web Part, na seção Propriedades do Refinamento da Pesquisa, verifique se Escolher Refinadores neste Web Part está selecionado.

    • Clique em Escolher refinadores.

    • Na página de configuração de refinamento, na seção de refinadores disponíveis, use os botões para escolher uma ou mais propriedades que contêm entidades extraídas que você quer mostrar como refinadores na lista e clique em Adicionar. Por exemplo, se você implantou um dicionário de extração de palavras, escolha WordCustomRefiner1.

    • Na seção Configurar para, configure como você deseja que cada refinador apareça.

  4. Clique em OK.

Visão geral dos tipos de extrator de entidade personalizada

A tabela seguinte mostra o tipo de dicionários de extração personalizados que pode criar e a forma como as entradas do dicionário são correspondidas com o conteúdo no índice de pesquisa, que nome do dicionário deve utilizar quando implementar o dicionário e que propriedade gerida irá conter as entidades extraídas.


Extrator de entidade personalizada/dicionário do extrator de entidade personalizada Descrição Exemplo Nome de dicionário a usar no Windows PowerShell Propriedade gerenciada que contém a entidade extraída
Extração de palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondem o conteúdo tokenizado, máximo de 5 dicionários. A entrada "âncora" corresponde a "âncora" e "Âncora", mas não "ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [em que n = 1,2,3,4 ou 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
Extração de parte da palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondem o conteúdo não tokenizado, máximo de 5 dicionários. A entrada "âncora" corresponde a "âncora", "Âncora" e "ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [em que n = 1,2,3,4 ou 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
Extração exata de palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondendo o conteúdo tokenizado, máximo de 1 dicionário. A entrada "âncora" corresponde a "âncora", mas não a "Âncora" ou "Ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
Extração exata de parte da palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondendo o conteúdo não tokenizado, máximo de 1 dicionário. A entrada "âncora" corresponde a "âncora" e "ancoragem", mas não "Âncora" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

Confira também

Import-SPEnterpriseSearchCustomExtractionDictionary