Compartilhar via


Topologia de farm do FAST Search Server (FAST Search Server 2010 para SharePoint)

 

Aplica-se a: FAST Search Server 2010

Tópico modificado em: 2012-01-20

Importante

Este artigo foi traduzido por um sistema de tradução automática, leia o aviso de isenção de responsabilidade. Para sua referência, veja a versão em inglês deste artigo aqui.

Este tópico descreve a topologia de farm do Microsoft FAST Search Server 2010 for SharePoint, incluindo os vários componentes que podem ser dimensionados em diversos servidores por razões de desempenho e de tolerância a falhas.

Para obter mais informações sobre a topologia de farm geral do Planejar topologia de farm (FAST Search Server 2010 para SharePoint), consulte o Microsoft SharePoint Server 2010.

Neste artigo:

  • O fluxo de conteúdo

  • Componentes dentro do FAST Search Server 2010 de farm do SharePoint

  • Conceitos de implantação

O fluxo de conteúdo

Planejar e projetar coleções de conteúdo (FAST Search Server 2010 para SharePoint) recupera o conteúdo para indexação com um ou mais dos conectores de indexação com suporte. O FAST conteúdo Search Service Application (SSA) é o conector de indexação padrão e recupera o conteúdo de várias fontes de conteúdo, como repositórios de conteúdo do SharePoint, servidores Web, pastas do Exchange, linha de servidores de arquivos e dados de negócios. Você pode usar outros conectores de indexação de FAST Search Server 2010 for SharePoint para cenários de recuperação de conteúdo mais específicos. Para obter mais informações sobre as opções de conector de indexação, consulte o FAST Search Server 2010 for SharePoint.

Processamento do item extrai o conteúdo pesquisável de documentos recuperados e processa os itens com base no idioma de escrita.

O componente de indexação converte o conteúdo pesquisável invertidos índices que são usadas por sua vez ajustando a consulta.

Processamento de consultas processa consultas do usuário por meio de transformações de consulta, tal como sinônimo de expansão, antes da consulta propriamente dita correspondência com o índice.

Correspondência de consulta usa os índices de pesquisa para retornar os itens que correspondem a uma consulta de usuário. Os itens são retornados em uma lista de ocorrência de consulta é classificada por relevância para a consulta especificada.

FAST Search Server 2010 for SharePoint interage com a infra-estrutura do Active Directory e as declarações para resolver as permissões e participações em grupos. Ele, em seguida, retorna apenas itens que o usuário atual tem permissão para ver, de acordo com as configurações de fonte de conteúdo.

Componentes dentro do FAST Search Server 2010 de farm do SharePoint

FAST Search Server 2010 for SharePoint pode executar em um único nó. Ou, você pode dimensionar a executar um ou mais dos componentes em vários nós. Nesse caso o sistema pode indexar um maior número de itens, lidar com mais atualizações do item, reduzir a latência de indexação ou responder a mais consultas por segundo.

A figura a seguir mostra os principais componentes do FAST Search Server 2010 for SharePoint.

FAST procurar a topologia de farm do SharePoint

Topologia de farm do FAST Search Server

As subseções a seguir descrevem a funcionalidade para cada componente.

Processamento do item

O componente de processamento do item recebe itens a serem indexados no conectores de indexação. e processar os itens de acordo com a configuração fornecida. Envia os itens processados para o serviço de indexação.

Os principais recursos do serviço de processamento de item são:

  • Gerenciamento de mapeamento de propriedades rastreadas para propriedades.   Propriedades gerenciadas contêm o conteúdo será indexado, incluindo os metadados associados com os itens.

    Em primeiro lugar, você descobrirá as propriedades rastreadas em um conjunto inicial de itens rastreados. Com base nisso, você pode alterar o mapeamento para propriedades gerenciadas.

  • Análise dos formatos de documento como Word, Excel e PDF.   Isso inclui a extração de texto de pesquisa e os metadados desses formatos.

  • Extração de propriedades do conteúdo rastreado.   Propriedade extração detecta várias propriedades, como nomes e datas e mapeá-las para propriedades gerenciadas. Dessa maneira pode consultar essas propriedades e também se aplica o ajuste de consulta com base nessas propriedades. Propriedades-chave extraídas são nomes de empresas, nomes de pessoas, locais e datas.

    Também é possível criar extractors de propriedade personalizada usando, por exemplo, um dicionário de nomes de produtos relevantes à sua organização.

  • Lingüísticos o processamento de itens antes de indexação.   Na pesquisa, lingüístico é definido como o uso das informações sobre a estrutura e a variação de idiomas para que os usuários podem facilmente encontrar informações relevantes. A relevância do item com relação a uma consulta não é necessariamente decidida com base nas palavras comuns à consulta e o documento, mas em vez disso, na medida em que o seu conteúdo satisfaz o usuário precisa para obter informações.

    O processamento lingüístico inclui a detecção do idioma de escrita e lingüística normalização de conteúdo de acordo com o idioma fornecido. Normalização lingüística inclui caracteres normalização e a normalização de lematização variações.

FAST Search Server 2010 for SharePoint permite que você personalize a forma como são processados os itens — por exemplo, especificando quais tipos de propriedades para extrair e como eles podem ser consultados.

O distribuidor de conteúdo se comunica com os conectores de indexação e organiza a alimentação de documentos da indexação de conectores para o serviço de indexação. Você pode configurar um primário e um distribuidor de conteúdo de backup para tolerância a falhas.

Você pode configurar o item de vários nós para tolerância a falhas e desempenho de processamento. Determinadas operações de processamento do item são processamento intensivo e exigirão mais de um item de nó para tratar a taxa de alimentação de processamento.

O analisador de Web tem duas funções principais: ele analisa os logs de cliques de pesquisa e estruturas de hiperlink. Ambos contribuem para melhor fileira resultados.

Itens que mostram vários cliques no log de instalação através de cliques de pesquisa são populares e, portanto, recebem melhores pontuações de classificação dos itens exibidos a menos. Também são percebida, os itens que estão vinculadas a partir de muitos outros itens para ser mais relevantes para o usuário e, portanto, receber melhores pontuações de classificação.

O analisador de Web melhora a relevância de pesquisa, analisando o gráfico de vínculo e adicionar textos de âncora e um aumento de posto independente da consulta com base em um link de cardinalidade dos itens no índice. Textos de âncora descrevem os itens que eles consultem e irão melhorar a relevância e de recuperação quando o texto de ancoragem corresponde a um termo da consulta. Itens com muitos links apontando para eles irão classificação superior

O analisador de Web pode dimensionar para vários nós para reduzir o tempo total necessário para a análise. Isso é feito pela adição de componentes de banco de dados de pesquisa dedicados e componentes que são usados durante a análise de link de processamento de link.

O componente de processamento de vínculo recebe as tarefas do analisador de Web durante o processamento de vínculo. Instalações de grande escala usam vários processadores de link.

O componente de banco de dados de consulta representa um servidor de pesquisa de chave/valor que recupera as informações de link geradas pelo processamento de link. O processamento do item irá procurar as informações de vínculo para um item usando o URL como chave. Instalações de grande escala usam vários componentes de banco de dados de pesquisa.

Cluster de pesquisa

O cluster de pesquisa fornece a topologia do principal para a indexação e consulta correspondente. Estes componentes requerem seus próprios modelos que usam uma matriz de servidores em uma configuração de linha/coluna de dimensionamento. A figura a seguir mostra os principais conceitos usados em uma topologia de cluster de pesquisa.

Arquitetura de cluster do FAST Search

Arquitetura de cluster do FAST Search

  • Coluna de índice   O índice de pesquisa completo pode ser dividido em várias colunas de índice separado quando o índice completo é muito grande para ser residem em um servidor. Uma consulta será avaliada em relação a todas as colunas de índice dentro do cluster de pesquisa e os resultados de cada coluna de índice são mesclados na lista de ocorrência da consulta final.

  • Linha de pesquisa   Um conjunto de nós de busca que contêm todos os itens indexados dentro do cluster de pesquisa. Uma linha de pesquisa consiste em um nó de pesquisa para cada coluna de índice dentro do cluster de pesquisa. Você pode usar várias linhas de pesquisa para oferecer o compartilhamento de carga de desempenho e tolerância a falhas.

  • Principal e backup indexador   Você pode configurar um nó do indexador de backup para tolerância a falhas. Os dois indexadores produzem o mesmo conjunto de índices, mas somente o indexador principal distribui os índices para a correspondência de nós de consulta.

Importante

Os nós do indexador primário e de backup são especificados como linhas do indexador no arquivo de configuração de implantação (deployment.xml). Linhas de pesquisa e linhas de indexador usam a mesma linha no arquivo de configuração de implantação de numeração.

A indexação

O componente de indexação cria índices invertidos, com base nos itens que ele recebe. O componente de indexação envia esses índices invertidos para a consulta de correspondência de componente para uso posterior durante a avaliação da consulta.

O serviço de indexação consiste em dois componentes, o componente de indexação dispatcher e o componente de indexação. Se o serviço de indexação for implantado em vários nós, instâncias desses componentes também serão implantadas em vários nós.

Se você tiver mais de uma coluna de índice, você deve combinar os índices para produzir os resultados da pesquisa consistente. Nesse caso, você precisará implantar um nó de indexação para cada coluna de índice. O dispatcher indexação gerencia o roteamento de itens processados para a coluna correta.

O serviço de indexação pode ser expandido para fora de acordo com para o número de itens. Se o serviço de indexação é executada em um único nó, tanto o número de itens pode manipular por segundo e o número total de itens podem incluir no índice são limitados. Para dimensionar o serviço de indexação, você pode implantá-lo em mais de uma coluna de índice. Cada coluna de índice irá conter uma parte do índice e o conjunto combinado de colunas do índice formarão o índice completo. Nesse caso, cada nó de indexação tratará apenas uma parte do índice inteiro, e assim que ele se adapta o número de itens que podem ser indexadas por segundo e o número total de itens. Além disso, nós a indexação de backup pode oferecer tolerância a falhas.

Também é possível usar vários distribuidores de indexação para ambos os motivos de desempenho e tolerância a falhas. Normalmente você implanta o dispatcher de indexação no mesmo nó como o nó principal de indexação.

Correspondência de consulta

O serviço de correspondência de consulta usa invertidos índices criados pelo serviço de indexação para recuperar os itens que correspondem a uma consulta e, em seguida, retornam a esses itens como uma lista de ocorrência da consulta. Geralmente, uma consulta contiver vários termos combinados com operadores de consulta, como, por exemplo, AND e OR. A consulta de correspondência de serviço de procura a cada termo do índice e recupera uma lista de itens em que esse termo é exibida. No caso de um operador AND, por exemplo, a lista de hit consulta consistirá do conjunto de itens que contêm todos os termos. A ordem dos itens devolvidos se baseia o mecanismo de classificação solicitado, o que é geralmente uma classificação complexa que é calculada a partir de várias propriedades de item ou uma classificação com base em um ou mais das propriedades do item.

A consulta de correspondência de serviço também pode retornar um acerto resumo realçado para cada item na lista de ocorrência de consulta. Um resumo de ocorrência realçado consiste de um fragmento do item original na qual os termos da consulta correspondente são realçados.

A consulta de correspondência de serviço é responsável pelo refinamento profunda que está associado com os resultados da consulta. Ajuste de consulta permite que a busca detalhada em um resultado de consulta, usando os dados agregados de estatísticos que foi calculados para o resultado da consulta. A consulta de serviço de correspondência mantém as estruturas de dados de agregação para habilitar o refinamento profunda entre conjuntos de resultados grande.

Você pode implantar a consulta de correspondência de serviço em uma configuração de linha/coluna para obter tolerância a falhas e de escala no volume de conteúdo e a consulta. Colunas de índice fornecem maneiras de dimensionar para o volume de conteúdo, índice geral de particionamento em um conjunto de colunas de separação. Linhas de pesquisa fornecem maneiras de dimensionar para o volume de consulta, duplicando a mesma partição do índice em mais de um nó da consulta correspondente.

Importante

O número de colunas na consulta de serviço de correspondência sempre é igual a número de colunas no serviço do indexador. O motivo é que as colunas de índice representam a uma partição do índice, e cada nó de correspondência de consulta pode manipular apenas um tal partição do índice.

Linhas de pesquisa e linhas de indexador dimensionam forma independente. Uma linha de pesquisa duplica outra linha de pesquisa para fornecer tolerância a falhas e uma capacidade maior de consultas. Uma linha do indexador serve como um mecanismo de backup para fins de tolerância a falhas durante a indexação.

O processamento de consulta

O componente de processamento de consulta executa pré-processando consultas e pós-processamento dos resultados. Processamento de consultas inclui query–language análise lingüístico processamento e processamento de segurança em nível de item. Processamento de resultados inclui mesclar os resultados de várias colunas de índice, a formatação de lista de ocorrência de consulta, formatação de dados de ajuste de consulta e a remoção de duplicatas.

O componente de processamento de consulta interage com o componente FAST Search Authorization (FSA) para certificar-se de que o usuário que está executando uma consulta vê apenas os resultados que ele ou ela está autorizada a ver. O serviço de processamento da consulta, portanto, valida as permissões do usuário e reescreve a consulta de entrada com um filtro de acesso que corresponda à associação de grupo e usuário atual.

A serviço de processamento de consultas podem ser dimensionadas em vários nós para lidar com a tolerância a falhas e mais consultas por segundo. Nesse caso, todos os nós precisará ser configurado da mesma maneira.

Administração do sistema

As FAST Search Server 2010 for SharePoint Administração Central do site coleta interfaces do usuário e fornecem as interfaces administrativas para gerenciar a implantação de SharePoint Server 2010 e os recursos. Cmdlet com a configuração do sistema e de recurso, o log, o esquema de índice de pesquisa e administração de autorização e serviços comuns de administração do sistema incluem a interface do usuário.

Importante

Algumas operações administrativas só podem ser executadas, usando os cmdlets Windows PowerShell ou usando as ferramentas de linha de comando.

O componente de administração contém funcionalidade para controlar a experiência de pesquisa, tais como determinar como realizar a extração de propriedades, averiguar quais sinônimos para usar, e determinar quais itens para usar como melhores opções.

O Gerenciador de FSA é uma parte do serviço de administração que gerencia a autorização do usuário para o conteúdo indexado. Isso garante que apenas os itens que um usuário é o direito de ler apareçam nos resultados da consulta. O Gerenciador de FSA se comunica com os serviços de declarações, serviços do Active Directory ou outra LDAP como base os serviços de diretório para gerenciar o processo de autorização.

Administração de esquemas de índice

Uma parte fundamental do serviço de administração é a administração do esquema de índice. O esquema de índice contém todas as entidades de configuração são necessários para gerar os arquivos de configuração que são relacionados ao esquema do índice para todos os outros serviços do sistema.

O índice de esquema controla quais propriedades gerenciadas de um item serão indexadas, como as propriedades serão indexadas e as propriedades que podem ser retornadas na lista de ocorrência de consulta.

O perfil de classificação é uma parte do esquema de índice que controla como a lista de ocorrência da consulta será classificada por relevância. Você pode configurar o cálculo de relevância, usando um conjunto de parâmetros de classificação de perfil.

Autorização de pesquisa FAST (FSA)

O Gerenciador de FAST Search Authorization (FSA) é uma parte do serviço de administração que gerencia a autorização do usuário para o conteúdo indexado.

O Gerenciador de FSA concede aos usuários acesso a indexação de itens com base no usuário de permissões de leitura nos repositórios de fonte de conteúdo. Isso garante que apenas os itens que um usuário é o direito de ler apareçam nos resultados da consulta.

O Gerenciador de FSA se comunica com os serviços do Active Directory ou outra LDAP baseado em diretório serviços para gerenciar o processo de autorização.

O rastreador FAST buscar na Web é um conector de indexação opcional que pode ser usado para cenários de rastreamento da Web complexos que envolvam uma mistura de sites da Internet e intranet.

Você pode encontrar mais informações sobre as diferenças entre os sites de Web de rastreamento com o FAST pesquisar conteúdo SSA e com o FAST pesquisar na Web Crawler em Planejar e projetar coleções de conteúdo (FAST Search Server 2010 para SharePoint).

O rastreador FAST buscar na Web leituras de páginas da Web e segue os links nas páginas para processar uma Web completa de itens. Ele passa os itens recuperados para o serviço de processamento do item.

Para obter mais detalhes da arquitetura sobre o rastreador FAST buscar na Web, consulte o Rastreando conteúdo da Web com o rastreador da Web do FAST Search.

Conceitos de implantação

Os seguintes termos são usados no processo de implantação.

  • Host (servidor)   Um computador servidor que pode hospedar os componentes FAST Search Server 2010 for SharePoint em uma arquitetura distribuída. Um host pode executar vários nós de tipos de iguais ou diferentes. Um host é identificado com o Domain Name FQDN (totalmente qualificado).

  •    Uma instância de um componente de software implantada em um único host. Exemplos: Item de processamento de nó, o indexador do nó, o nó de consulta correspondente. Nós são implantados em um conjunto de servidores.

    Importante

    Executando vários nós do mesmo tipo em um único servidor pode representar um afunilamento de desempenho e normalmente não é recomendado.

  • Cluster de pesquisa   O cluster de pesquisa representa a topologia para a consulta de correspondência e a indexação de nós na sua implantação. Estes componentes requerem seus próprios modelos que usam uma matriz de servidores em uma configuração de linha/coluna conforme descrito acima de dimensionamento.

Observação

Aviso de Isenção de Tradução Automática: Este artigo foi traduzido por computador, sem intervenção humana. A Microsoft oferece essas traduções automáticas para ajudar as pessoas que não falam inglês a aproveitar os textos escritos sobre produtos, serviços e tecnologias da Microsoft. Como este artigo foi traduzido automaticamente, é possível que contenha erros de vocabulário, sintaxe ou gramática.

See Also

Concepts

Disponibilidade e redundância de farms de servidores do FAST Search Server
Planejar e projetar coleções de conteúdo (FAST Search Server 2010 para SharePoint)
Opções de implantação de farm do FAST Search Server (FAST Search Server 2010 para SharePoint)
Planejar topologia de farm (FAST Search Server 2010 para SharePoint)

Other Resources

Planejar o esquema de índice (FAST Search Server 2010 para SharePoint) (traduzido por máquina)