Editar um arquivo do dicionário de sinônimos (Office SharePoint Server)
Atualizado em: 2008-12-11
Um arquivo de dicionário de sinônimos é um recurso de pesquisa de expansão de consultas no 1st_OSS_12 que permite aos usuários digitar uma frase em uma caixa de pesquisa e receber resultados para palavras relacionadas à frase que foi inserida. Por exemplo, uma pesquisa para a palavra "beber" deverá retornar os resultados que contêm as palavras "beber" ou "sorver" se os dois termos forem relacionados no arquivo de dicionário de sinônimos. Em um arquivo de dicionário de sinônimos, você usa conjuntos de substituições para especificar padrões que são substituídos por valores alternativos e usa conjuntos de expansão para retornar valores adicionais que são sinônimos do padrão especificado. Neste artigo: Noções básicas sobre arquivos de dicionário de sinônimos Usando conjuntos de substituição Usando conjuntos de expansão Editando um arquivo de dicionário de sinônimos Lista de arquivos de dicionário de sinônimos por idioma Quando o 1st_OSS_12 é instalado, um arquivo de dicionário de sinônimos é automaticamente incluído para cada um dos idiomas aceitos pelo 2nd_OSS_12, juntamente com um arquivo neutro de dicionário de sinônimos, tsneu.xml. O arquivo neutro de dicionário de sinônimos tsneu.xml é aplicado a consultas que não têm um arquivo de dicionário de sinônimos associado ao idioma da consulta. O arquivo neutro de dicionário de sinônimos é sempre aplicado a consultas, mesmo quando há um arquivo de dicionário de sinônimos específico associado ao idioma da consulta. Para obter mais informações, consulte a seção "Lista de arquivos de dicionário de sinônimos por idioma". Por padrão, os arquivos de dicionário de sinônimos são criados e armazenados no seguinte local do servidor de consulta: Unidade:\Arquivos de Programa\Microsoft Office Servers\12.0\Data\Config. Os arquivos de dicionário de sinônimos desse local padrão são copiados para o seguinte local de pasta de cada instância do serviço de Pesquisa da Microsoft que existe no servidor de consulta: Unidade:\Arquivos de Programa\Microsoft Office Servers\12.0\Data\Office Server\Applications\<UID do aplicativo>\Config, em que <UID do aplicativo> é o GUID associado a um provedor de serviços compartilhado específico. Se você modificar os arquivos de dicionário de sinônimos no local padrão, a versão modificada dos arquivos será copiada automaticamente toda vez que um novo Provedor de Serviços Compartilhado (SSP) for criado. Se você modificar os arquivos de dicionário de sinônimos no local padrão depois que tiver criado um SSP, será necessário copiar os arquivos do local padrão para o diretório especificado para cada SSP que já existe. Um arquivo chamado tsschema.xml é instalado no mesmo diretório com os arquivos de dicionário de sinônimos. Não modifique o arquivo tsschema.xml. Esse arquivo é mencionado por todos os outros arquivos de dicionário de sinônimos e alterar esse arquivo pode levar ao funcionamento inadequado da pesquisa. Por padrão, cada arquivo do dicionário de sinônimos contém conteúdo de amostra inativo. Você deve editar um arquivo de dicionário de sinônimos para que ele possa ser usado pela pesquisa. Os arquivos de dicionário de sinônimos contêm dois tipos principais de entradas: conjuntos de substituição e conjuntos de expansão. Essas entradas serão descritas mais detalhadamente nas próximas seções deste tópico. Um terceiro tipo de entrada, diacritics_sensitive, é usado para especificar se essas marcas diacríticas, como acentos, são ignoradas ou respeitadas pela pesquisa. Por padrão, os sinais diacríticos são ignorados, portanto o valor é definido como 0. Para que as marcas diacríticas sejam respeitadas pela pesquisa, altere o valor para 1. A seguir está um exemplo do XML padrão em um arquivo de dicionário de sinônimos: <XML ID="Microsoft Search Thesaurus"> <!-- Commented out <thesaurus xmlns="x-schema:tsSchema.xml"> <diacritics_sensitive>0</diacritics_sensitive> <expansion> <sub>Internet Explorer</sub> <sub>IE</sub> <sub>IE5</sub> </expansion> <replacement> <pat>NT5</pat> <pat>W2K</pat> <sub>Windows 2000</sub> </replacement> <expansion> <sub>run</sub> <sub>jog</sub> </expansion> </thesaurus> --> </XML>
Do ponto de vista do desempenho, é importante saber quantos itens são definidos no arquivo de dicionário de sinônimos e não exceder 1.000/10.000 (típico/máximo) itens. Esteja ciente de que cada marca <pat> ou <sub> conta como um item definido que se opõe aos valores recomendados. As entradas que você adicionar ao arquivo do dicionário de sinônimos não podem conter somente caracteres especiais. No entanto, você pode ter entradas em branco. Por exemplo, se você quiser verificar se as consultas de um termo específico não retornam resultados, altere a entrada. No exemplo a seguir, as consultas do termo "windows" não retornarão nenhum resultado: <replacement> <pat>windows</pat> <sub></sub> </replacement>
Palavras de ruído podem ser incluídas em um arquivo de dicionário de sinônimos. No entanto, elas serão filtradas em um estágio posterior se você também estiver usando um arquivo de palavras de ruído. Para obter mais informações, consulte Edit a noise word file (Office SharePoint Server 2007). Um conjunto de substituição especifica um padrão que foi substituído por uma ou mais substituições em uma consulta de pesquisa. Por exemplo, você pode adicionar um conjunto de substituição em que “W2K” é o padrão e “Windows 2000” é a substituição. Uma consulta do termo “W2K”, 2nd_OSS_12 retornará apenas resultados da pesquisa que contêm o termo “Windows 2000”. Os resultados da pesquisa não retornarão itens que contêm o termo “W2K”. Cada conjunto de substituição é incluído em uma marca <replacement>. Na marca de substituição, especifique um ou mais padrões e coloque-os entre as marcas <pat>, e especifique uma ou mais substituições colocando-as em uma marca <sub>. Padrões e substituições podem conter uma palavra ou uma sequência de palavras. Por exemplo, para adicionar um conjunto de substituição em que “W2K” é o padrão e "Windows 2000” é a substituição, use o seguinte: <replacement> <pat>W2K</pat> <sub>Windows 2000</sub> </replacement>
É possível ter mais de uma substituição para cada padrão que você especificar. O ideal é que conjuntos de substituição sejam usados com termos que todos reconheçam como sendo iguais. Por exemplo, considere o cenário onde um termo preterido, como um nome de produto interno, deve ser substituído por outro termo em uma consulta, como o nome do produto lançado. Um conjunto de expansão é um grupo de substituições que são sinônimas umas das outras. Consultas que contêm correspondências em uma substituição são expandidas para incluir todas as substituições no conjunto de expansão. Por exemplo, você pode adicionar um conjunto de expansão em que as seguintes substituições são sinônimas: escritor autor jornalista Se você consultar o termo "autor", o 2nd_OSS_12 também retornará os resultados de pesquisa que contêm o termo "escritor" e o termo "jornalista". Cada conjunto de expansão é incluído em uma marca <expansion>. Na marca <expansion>, especifique uma ou mais substituições entre as marcas <sub>. No exemplo anterior, adicione as seguintes linhas: <expansion> <sub>escritor</sub> <sub>autor</sub> <sub>jornalsita</sub> </expansion>
Você pode incluir palavras individuais ou frases em um arquivo de dicionário de sinônimos. O separador de palavras de um determinado idioma identifica palavras individuais, determinando onde os limites da palavra existem com base nas regras lexicais do idioma. Se você incluir uma palavra em um arquivo de dicionário de sinônimos que o separador de palavras não reconheça como uma única palavra, você também deverá incluir a palavra em um dicionário personalizado para que o separador de palavras não divida a palavra em tokens menores. Por exemplo, se você usar a palavra “IT&T” em um conjunto de expansão, mas não incluí-lo em um dicionário personalizado, o separador de palavras poderá dividir a palavra em duas partes distintas, “IT” e “T”. Isso pode fazer com que o conjunto de expansão não funcione conforme esperado quando uma consulta de pesquisa for executada. Para obter informações sobre a criação e o uso de dicionários personalizados, consulte Create a custom dictionary (Office SharePoint Server 2007). Use o procedimento a seguir para editar um arquivo de dicionário de sinônimos. Ao editar um arquivo, você deve usar pares correspondentes de abertura e fechamento de marcas ao redor de cada entrada no arquivo. Se as marcas XML no arquivo de dicionário de sinônimos não tiverem correspondência, um erro será registrado no log de eventos do aplicativo. Inicie o Bloco de Notas e abra um arquivo de dicionário de sinônimos. Para obter informações sobre como localizar e identificar o arquivo de dicionário de sinônimos apropriado, consulte a seção "Noções básicas sobre arquivos de dicionário de sinônimos". Se você estiver alterando o arquivo de dicionário de sinônimos pela primeira vez, remova a linha de comentários <!-- Commented out que aparece no início do arquivo, assim como a lista de comentários --> que aparece no fim do arquivo. Faça as alterações no arquivo de dicionário de sinônimos. Adicione, modifique ou exclua um conjunto de substituição ou um conjunto de expansão. Salve o arquivo de dicionário de sinônimos e feche o Bloco de Notas.