Como carregar separadores de palavras de terceiros licenciados
O SQL Server 2008 inclui separadores de palavras de terceiros licenciados para os seguintes idiomas:
Dinamarquês
Polonês
Turco
Esses separadores de palavras estão disponíveis, mas não são instalados por padrão e devem ser registrados manualmente e adicionados à lista de LCIDs suportados para indexação e consulta de texto completo.
Informações de pré-requisito
Para que possa carregar um separador de palavras, você precisa das seguintes informações:
Nomes de instância de cada instância do SQL Server na qual deseja registrar os separadores de palavras.
O caminho FTDATA de cada instância.
Depois de obter as IDs das instâncias, recupere o caminho específico da instância apropriado à pasta FTData. Você usará esse caminho ao adicionar os valores de configuração que especificam os arquivos de léxico e de dicionário de sinônimos de um idioma.
Para obter a ID de uma instância do SQL Server
Clique em Iniciar e em Executar.
Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.
Clique em OK. O Editor do Registro será aberto.
Navegue até HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\Instance Names\SQL. Lá, o painel direito exibe, na coluna Dados, o nome e a ID de cada instância instalada do SQL Server. Obtenha a ID de cada instância de servidor em que você carregará separadores de palavras de terceiros.
Para obter o caminho FTData de cada instância
Clique em Iniciar e em Executar.
Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.
Clique em OK.
No Editor do Registro, selecione a seguinte chave do Registro de uma instância do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\ID_da_instância\MSSQLServer, onde ID_da_instância é o identificador da instância de servidor em que você está carregando separadores de palavras. Por exemplo, para a instância de servidor padrão, o valor da chave do Registro é:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\Setup
O painel direito exibe o valor FullTextDefaultPath, que contém o caminho específico da instância para a pasta FTData. Por exemplo, para a instância padrão do SQL Server 2008, o caminho é:
C:\Arquivos de Programas\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\FTData
Registrando um separador de palavras e os componentes lingüísticos relacionados
O procedimento de instalação da Microsoft para separadores de palavras de terceiros licenciados consiste em três fases. A lista a seguir resume esses estágios, cujas etapas são descritas posteriormente nesta seção.
Adicione o(s) ID(s) de Classe COM referente(s) às interfaces de separador de palavras e lematizador do idioma que está sendo registrado como uma chave para o nó <InstanceRoot>\MSSearch\CLSID do Registro.
Adicione uma chave ao nó <InstanceRoot>\MSSearch\Language para o idioma.
Adicione os valores de configuração que especificam a localização do léxico e dos arquivos de dicionário de sinônimos do idioma.
Observação |
---|
O separador de palavras para dinamarquês é usado como um exemplo nesta seção. Os valores necessários para a instalação de separadores de palavras de cada idioma são fornecidos nas tabelas mais adiante neste tópico. |
Fase 1: Adicionar o(s) ID(s) de Classe COM referente(s) às Interfaces do Separador de Palavras e do Lematizador do idioma que está sendo registrado
Cuidado |
---|
A edição incorreta do Registro pode danificar seriamente o sistema. Antes de alterar o Registro, faça um backup dos dados importantes do computador. |
Para adicionar ID(s) de Classe COM desses componentes para o idioma dinamarquês**:**
Abra o Editor do Registro:
Clique em Iniciar e em Executar.
Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.
No Editor do Registro, selecione a seguinte chave do Registro para a instância do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\CLSID
Na barra de menus, clique em Editar, clique em Novo e clique em Chave.
Digite {16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}.
Pressione ENTER.
No painel à direita, clique com o botão direito do mouse no valor do Registro Default e, em seguida, clique em Modificar.
Na caixa de diálogo Editar Cadeia de Caracteres, na caixa Dados de valor, digite danlr.dll e clique em OK.
Repita as etapas 3 a 7, substituindo o valor da etapa 4 por {83BC7EF7-D27B-4950-A743-0F8E5CA928F8}.
Para um dado idioma, siga as etapas acima, substituindo os valores de chave das etapas 4 e 8 pelos valores de chave do idioma desejado. Esses valores estão listados abaixo. Na etapa 7, substitua danlr.dll pelo nome .dll do idioma desejado.
Idioma |
Valor da chave para a etapa 4 |
.DLL para a etapa 7 |
Valor da chave para a etapa 8 |
---|---|---|---|
Dinamarquês |
{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D} |
danlr.dll |
{83BC7EF7-D27B-4950-A743-0F8E5CA928F8} |
Polonês |
{B8713269-2D9D-4BF5-BF40-2615D75723D8} |
lrpolish.dll |
{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6} |
Turco |
{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6} |
trklr.dll |
{8DF412D1-62C7-4667-BBEC-38756576C21B} |
Fase 2: Adicionar uma chave ao nó <InstanceRoot>\MSSearch\Language para o idioma
Para adicionar uma chave a esse nó para o idioma dinamarquês:
Selecione a seguinte chave do Registro para a instância padrão do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language
Repita as etapas de 3 a 5 do procedimento anterior, substituindo o nome da chave na etapa 4 por dan.
Para um dado idioma, siga as etapas anteriores, substituindo o nome da chave na etapa 4 pelo valor listado abaixo para o idioma específico.
Idioma |
Nome da chave para a etapa 4 |
---|---|
Dinamarquês |
dan |
Polonês |
plk |
Turco |
trk |
Fase 3: Adicionar valores de configuração que especificam a localização de cada componente lingüístico de um idioma
Para adicionar valores de configuração para esses componentes para o idioma dinamarquês:
Selecione a chave do Registro que você digitou na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\dan
Na barra de menus, clique em Editar, em Novo e em Valor da Cadeia de Caracteres.
Digite TsaurusFile.
Pressione ENTER.
Clique com o botão direito do mouse no valor do Registro TsaurusFile que você acabou de adicionar e clique em Modificar.
Na caixa de diálogo Editar Cadeia de Caracteres, na caixa Dados devalor, digite tsdan.xml.
Clique em OK.
Repita as etapas de 2 a 7 para os demais componentes lingüísticos do idioma — arquivo de dicionário de sinônimos, idioma (localidade), separador de palavras e lematizador. Os valores para registrar esses componentes para os idiomas dinamarquês, polonês ou turco são fornecidos abaixo.
Valores para dinamarquês
Repita as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.
Tipo de valor para a etapa 2 |
Nomes de valor para as etapas 3 e 5 |
Tipo de valor para a etapa 6 |
---|---|---|
Valor da cadeia de caracteres |
TsaurusFile |
tsdan.xml |
Valor DWORD |
Localidade |
00000406 |
Valor da cadeia de caracteres |
WBreakerClass |
{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D} |
Valor da cadeia de caracteres |
StemmerClass |
{83BC7EF7-D27B-4950-A743-0F8E5CA928F8} |
Valores para polonês
Para o idioma polonês, siga as etapas descritas acima, usando os valores listados abaixo. Selecione a chave do Registro que você inseriu para polonês na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\plk
Execute as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.
Tipo de valor para a etapa 2 |
Nomes de valor para as etapas 3 e 5 |
Dados de valor para a etapa 6 |
---|---|---|
Valor da cadeia de caracteres |
TsaurusFile |
tsplk.xml |
Valor DWORD |
Localidade |
00000415 |
Valor da cadeia de caracteres |
WBreakerClass |
{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6} |
Valor da cadeia de caracteres |
StemmerClass |
{B8713269-2D9D-4BF5-BF40-2615D75723D8} |
Valores para turco
Para o idioma Turco, siga as etapas descritas acima, usando os valores listados abaixo. Selecione a chave do Registro que você inseriu para o idioma turco na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\trk
Execute as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.
Tipo de valor para a etapa 2 |
Nomes de valor para as etapas 3 e 5 |
Dados de valor para a etapa 6 |
---|---|---|
Valor da cadeia de caracteres |
TsaurusFile |
tstrk.xml |
Valor DWORD |
Localidade |
0000041f |
Valor da cadeia de caracteres |
WBreakerClass |
{8DF412D1-62C7-4667-BBEC-38756576C21B} |
Valor da cadeia de caracteres |
StemmerClass |
{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6} |
Atualizando a lista de idiomas suportados pela pesquisa de texto completo
Depois de carregar separadores de palavras de terceiros, você precisa atualizar a lista de LCIDs suportados para indexação e consulta de texto completo. Para atualizar a lista, use o procedimento armazenado do sistema sp_fulltext_service para atualizar a lista de idiomas, da seguinte maneira:
exec sp_fulltext_service 'update_languages';
Os idiomas dos separadores de palavras recém-carregados agora serão listados pela exibição do catálogo sys.fulltext_languages.