Planejar a pesquisa híbrida na nuvem para o SharePoint no Microsoft 365

APLICA-SE A:yes-img-132013 yes-img-16 2016yes-img-192019 yes-img-seSubscription Edition yes-img-sopSharePoint no Microsoft 365

Configurar a pesquisa híbrida na nuvem para o SharePoint no Microsoft 365 requer um planejamento cuidadoso. Este artigo ajuda você a criar uma solução de pesquisa híbrida de nuvem altamente confiável, segura e escalonável.

De quais experiências de pesquisa seus usuários precisam?

Quando você configura a pesquisa híbrida na nuvem e um rastreamento completo do conteúdo local é concluído, o Centro de Pesquisa do Office 365 exibe automaticamente os resultados híbridos do índice do Microsoft 365.

Pesquisar verticais – Pesquise verticais e reduza os resultados da pesquisa a um conjunto específico de conteúdo, por exemplo, para mostrar apenas vídeos. Se você atualmente usa uma vertical de pesquisa em uma Central de Pesquisa no SharePoint Server, precisará recriá-la no Centro de Pesquisa no SharePoint no Microsoft 365.

Pesquisa de site – Sua pesquisa existente em bibliotecas de documentos no SharePoint Server interrompe o retorno de resultados quando você move seu índice de pesquisa para o Microsoft 365. A pesquisa é mais rápida quando os usuários usam Os Centros de Pesquisa que estão no mesmo ambiente que o índice de pesquisa, portanto, pesquisar em um Centro de Pesquisa do Microsoft 365 oferece uma experiência melhor. Se os usuários precisarem de resultados do índice de pesquisa do Microsoft 365 em sites locais do SharePoint, como em Sites de Equipe existentes no SharePoint Server 2010, você poderá configurar a pesquisa no SharePoint Server 2013 ou no SharePoint Server 2016. Planeje uma fonte de resultado remota no SharePoint Server 2013 ou no SharePoint Server 2016 que obtém resultados do índice de pesquisa do Microsoft 365 e do uso do plano de federação de consulta. Como o SharePoint no Microsoft 365 processa suas consultas, seus usuários precisam usar a sintaxe de consulta compatível com o SharePoint no Microsoft 365. Saiba mais em Mostrar resultados do Microsoft 365 no SharePoint local com pesquisa híbrida em nuvem.

Descoberta Eletrônica - Talvez seja necessário configurar a Descoberta Eletrônica separadamente no SharePoint Server e no SharePoint no Microsoft 365.

Publicação entre sites – a publicação entre sites não está disponível na pesquisa híbrida na nuvem.

Como você deseja exibir os resultados da pesquisa?

Visualizações – Quando um usuário passa o mouse sobre um resultado de pesquisa proveniente do Microsoft 365, informações sobre o conteúdo e uma visualização do conteúdo são exibidas. As informações sobre o conteúdo dos resultados da pesquisa provenientes do local são exibidas automaticamente, mas você precisa configurar a exibição de visualizações para esse conteúdo. Planeje um farm do Office Aplicativos Web Server e configure o SharePoint Server 2013 para usar o Office Aplicativos Web Server. Saiba como em Mostrar resultados do Microsoft 365 no SharePoint local com pesquisa híbrida em nuvem.

Filtragem de segurança personalizada - O SharePoint no Microsoft 365 não oferece suporte à filtragem de segurança personalizada.

Você precisa de quais recursos de pesquisa?

Alguns dos recursos de pesquisa que você pode estar familiarizado com o SharePoint Server funcionam de forma diferente com a pesquisa híbrida na nuvem. Planeje informar seus usuários sobre as diferenças.

Melhores apostas – As melhores apostas são um recurso do SharePoint Server 2010. Use regras de consulta no SharePoint no Microsoft 365.

Escopos de pesquisa personalizados – Escopos de pesquisa personalizados são um recurso do SharePoint Server 2010. Em vez disso, use fontes de resultado no SharePoint no Microsoft 365.

Promoção/rebaixamento dos resultados da pesquisa – Promoção/rebaixamento dos resultados da pesquisa é um recurso do SharePoint Server 2010. Em vez disso, use fontes de resultado no SharePoint no Microsoft 365.

Remoção dos resultados da pesquisa local – Na Administração Central no SharePoint Server, você pode selecionar um aplicativo serviço Pesquisa e usar a opção "Redefinição de índice" para remover todos os itens do índice de pesquisa. Não use essa opção para um aplicativo de serviço Pesquisa de nuvem, a opção exclui o histórico de rastreamento dos bancos de dados de rastreamento, mas não remove itens locais do índice Microsoft 365 porque não há comunicação direta entre o aplicativo de serviço Pesquisa de nuvem no SharePoint Server e o índice de pesquisa no Office 365. Esses itens locais tornam-se órfãos no índice Microsoft 365. Se você quiser remover todos os metadados locais do índice de pesquisa do Microsoft 365, remova todas as fontes de conteúdo locais. Todos os itens locais deixados no índice de pesquisa do Microsoft 365 após a conclusão do processo são itens órfãos.

Alguns dos recursos de pesquisa que você pode estar familiarizado com o SharePoint Server não estão disponíveis com a pesquisa híbrida na nuvem. Planeje informar seus usuários.

Vários locatários no farm do SharePoint Server 2013 ou do SharePoint Server 2016 - Um farm do SharePoint Server 2013 ou do SharePoint Server 2016 só pode ser anexado a um único locatário no SharePoint no Microsoft 365, portanto, o SharePoint não pode preservar o isolamento de locatário de um farm do SharePoint Server 2013 ou SharePoint Server 2016 com vários locatários.

Extração de entidade personalizada - A Extração de entidade personalizada não está disponível com a pesquisa híbrida na nuvem, pois o SharePoint no Microsoft 365 não oferece suporte à extração de entidade personalizada.

Serviço web de enriquecimento de conteúdo externo - O serviço web de enriquecimento de conteúdo externo não está disponível com a pesquisa híbrida na nuvem, pois o SharePoint no Microsoft 365 não oferece suporte à extração de entidade personalizada.

Dicionário de sinônimos - Os dicionários de sinônimos não estão disponíveis na pesquisa híbrida na nuvem porque o SharePoint no Microsoft 365 não oferece suporte a dicionários de sinônimos.

Ao configurar a pesquisa híbrida na nuvem, uma das etapas é criar um aplicativo de serviço Pesquisa de nuvem (SSA na nuvem) no seu farm de pesquisa do SharePoint Server 2013 ou do SharePoint Server 2016. Quando você cria esse SSA na nuvem, uma arquitetura de pesquisa padrão é criada para você no servidor que executa o SSA na nuvem. Cada farm de pesquisa pode ter apenas um SSA de nuvem, mas pode ter vários SSAs em combinação com um SSA de nuvem.

Uma arquitetura de pesquisa para pesquisa híbrida na nuvem consiste em componentes de pesquisa e bancos de dados que formam uma topologia e servidores que hospedam essa topologia. Você precisa planejar o número de componentes de rastreamento para sua topologia, em quais servidores hospedar os componentes e bancos de dados de pesquisa e o hardware necessário para cada servidor.

Antes de começar, leia Saiba mais sobre a topologia de pesquisa para pesquisa híbrida na nuvem para se familiarizar com os componentes de pesquisa em uma arquitetura de pesquisa para pesquisa híbrida na nuvem.

Etapa 1: Quanto conteúdo local posso indexar no Microsoft 365?

Para cada 1 TB de espaço de armazenamento agrupado que seu locatário tem no SharePoint no Microsoft 365, você pode indexar 1 milhão de itens de conteúdo local no índice de pesquisa em Office 365. Você pode comprar mais espaço para aumentar sua cota até que ela atinja o limite de 20 milhões de itens. Se você precisar indexar mais de 20 milhões de itens de conteúdo local, entre em contato com Suporte da Microsoft para aumentar esse limite.

Etapa 2: De qual tamanho de arquitetura de pesquisa em nuvem preciso?

Para a pesquisa híbrida na nuvem, recomendamos usar a arquitetura de pesquisa padrão obtida ao criar um SSA em nuvem:

Imagem mostrando o farm de pesquisa com servidores e componentes de pesquisa.

Os componentes cinza estão inativos na pesquisa híbrida em nuvem, mas ainda precisam ser colocados em servidores, conforme mostrado. Leia sobre componentes inativos no Learn sobre a topologia de pesquisa para pesquisa híbrida em nuvem.

Assim como na pesquisa corporativa local, você pode dimensionar sua arquitetura de pesquisa. A diferença main é que, para a pesquisa híbrida na nuvem, é relevante apenas dimensionar o componente de rastreamento. Se você precisar ajustar o rastreamento, siga as diretrizes para rastreamento na topologia de pesquisa corporativa do Redesign para requisitos de desempenho específicos no SharePoint 2016 (as diretrizes para rastreamento também se aplicam à pesquisa híbrida na nuvem). Observe que, se você rastrear conteúdo local a uma taxa alta, o sistema poderá limitar a alimentação ao índice de pesquisa do Microsoft 365 para proteger a organização do Microsoft 365. Se sua arquitetura de pesquisa tiver até dois componentes de rastreamento, isso deverá resultar em uma taxa de rastreamento suficiente e aceitável.

Etapa 3: Quais requisitos de hardware devo conhecer para a arquitetura de pesquisa em nuvem?

Recomendamos uma arquitetura de pesquisa que use máquinas virtuais, mas você também pode usar máquinas físicas. Saiba mais em Escolher executar servidores física ou virtualmente.

Esta tabela mostra a quantidade mínima de recursos de hardware que cada servidor de aplicativos e de bancos de dados precisa:

Servidor No host Armazenamento RAM Processador1
Servidor de aplicativo
A
100 GB
16 GB
4 núcleos de CPU de 1,8 GHz
Servidor de banco de dados
B
100 GB
16 GB
4 núcleos de CPU de 1,8 GHz

1O número de núcleos da CPU é especificado aqui, mas não o número de threads da CPU.

Além do especificado acima:

  • Verifique se cada servidor host tem espaço em disco suficiente para a instalação base do sistema operacional Windows Server e para os arquivos do programa do SharePoint Server. O servidor de host também precisa de espaço livre no disco rígido para fazer diagnósticos, como log, depuração e criação de despejos da memória para as operações diárias e para o arquivo de página. Normalmente, 80 GB de espaço em disco são suficientes para o sistema operacional Windows Server e para os arquivos do programa do SharePoint Server.

  • Adicione armazenamento para o espaço de log do SQL para cada servidor do banco de dados. Se você não definir o servidor do banco de dados para fazer backup dos bancos de dados com frequência, o espaço de log do SQL usará muito armazenamento. Para mais informações sobre como planejar os bancos de dados SQL, consulte Configuração e planejamento da capacidade de armazenamento do SQL Server (SharePoint Server).

O modo pelo qual você decide distribuir os dados dos componentes de pesquisa e do sistema operacional em todo o seu armazenamento tem um impacto sobre o desempenho de pesquisa. É uma boa ideia:

  • Dividir os arquivos do sistema operacional do Windows Server, arquivos de programa do SharePoint Server e logs de diagnóstico em três volumes de armazenamento separados ou partições com desempenho normal.

  • Armazenar os dados de componentes de pesquisa em um volume ou partição de armazenamento distinto com alto desempenho.

Dica

Você pode definir um local personalizado para dados de componente de pesquisa ao instalar o SharePoint Server em um host. Qualquer componente de pesquisa no host que precisar armazenar dados, irá armazená-los nesse local. Para alterar esse local mais tarde, você precisa reinstalar o SharePoint Server nesse host.

Verifique se o armazenamento de que você dispõe é rápido o bastante para lidar com o tráfego dos componentes e bancos de dados de pesquisa. O banco de dados de rastreamento é o único componente na arquitetura de pesquisa para pesquisa híbrida na nuvem com requisitos IOPS. O banco de dados de rastreamento requer IOPS médio a alto e a carga típica em um subsistema de E/S é 10 IOPS por 1 documento por segundo (taxa de rastreamento DPS).

A topologia de pesquisa do SSA de nuvem consiste nos mesmos tipos de componentes de pesquisa e bancos de dados que a topologia de pesquisa de um SSA padrão no SharePoint Server 2013 ou no SharePoint Server 2016. Mas há algumas diferenças.

Componentes e bancos de dados de pesquisa não utilizados na pesquisa híbrida na nuvem – Na pesquisa híbrida na nuvem, é o Microsoft 365 que processa o conteúdo, armazena o índice e processa a análise. O SSA de nuvem não usa seu próprio componente de processamento de conteúdo, componente de índice, componente de processamento de análise, banco de dados de links ou banco de dados de análise. Esses componentes e bancos de dados estão ociosos.

Interação entre componentes de pesquisa e bancos de dados na pesquisa híbrida em nuvem – os componentes de pesquisa e os bancos de dados interagem de maneira diferente na topologia de pesquisa do SSA em nuvem, em comparação com a topologia de pesquisa de um SSA padrão:

Imagem mostrando as fontes de conteúdo, o farm de pesquisa com componentes de pesquisa e o Microsoft 365. As informações fluem a partir das fontes de conteúdo, através do componente de rastreamento e do Microsoft 365.

  1. O componente de rastreamento obtém conteúdo do seu farm local e envia esse conteúdo para o índice de pesquisa no Office 365. Ele usa conectores para interagir com as fontes de conteúdo e usa o banco de dados de rastreamento para armazenar informações temporárias e históricas sobre os itens que ele rastreamento, assim como um componente de rastreamento regular.

  2. O componente de administração de pesquisa executa processos do sistema que são essenciais para a pesquisa, assim como para um SSA padrão.

  3. Recomendamos executar todas as pesquisas do Microsoft 365, pois a pesquisa híbrida na nuvem é otimizada para isso. Mas, você pode configurar a pesquisa de site no SharePoint Server para obter resultados de pesquisa do índice de pesquisa em Office 365. Se você configurar a pesquisa em uma coleção de sites local para consultar seu índice Microsoft 365, esse componente de processamento de consulta passará consultas da caixa de pesquisa para o índice Microsoft 365 e resultará do índice Microsoft 365 para a caixa de pesquisa.

Decidir como gerenciar o rastreamento de seu conteúdo local

Você pode influenciar o desempenho de rastreamento e o frescor de pesquisa pela forma como gerencia rastreamentos, como usando fontes de conteúdo efetivamente, agendando rastreamentos e regras de rastreamento. As diretrizes para gerenciar o rastreamento para pesquisa local também se aplicam à pesquisa híbrida na nuvem, consulte Melhores práticas para rastreamento no SharePoint Server.

Decidir como sincronizar os Active Directories

Quando o conteúdo local é rastreado, analisado e criptografado, as ACLs (listas de controle de acesso) para cada item também são rastreadas. O índice de pesquisa do Microsoft 365 armazena as ACLs junto com o item, portanto, o sistema precisa ser capaz de reconhecer um usuário local como a mesma pessoa no Microsoft 365. Quando você configurou a sincronização do Active Directory entre sua rede local (Windows Server Active Directory) e sua organização do Microsoft 365 (Microsoft Entra ID), o sistema mapeia e traduz as ACLs para os usuários certos e os usuários obtêm resultados de pesquisa aparados de segurança do índice Microsoft 365.

Existem dois métodos para sincronizar Active Directories:

  • Sincronização de diretórios com a sincronização de senha

  • Sincronização de diretórios com SSO (logon único)

Se você escolher a opção de SSO, também poderá configurar a sincronização de senha, caso deseje um backup para SSO, mas deverá configurar pelo menos um dos dois (sincronização de senha ou SSO). Saiba mais e como configurar os dois métodos na integração do Microsoft 365 com ambientes locais.

Por que os usuários não podem obter resultados híbridos com a pesquisa híbrida na nuvem quando são membros do grupo de segurança Usuários do Domínio?

Algumas organizações não atribuem direitos de acesso ao conteúdo local usando um dos grupos de segurança padrão no Windows Server Active Directory (AD), por exemplo, o grupo de segurança Usuários de Domínio.

A ferramenta de sincronização Microsoft Entra Connect, por padrão, exclui alguns objetos da sincronização. Grupos de segurança que têm o atributo IsCriticalSecurityObject=true é um conjunto de objetos que a ferramenta exclui e Os Usuários de Domínio são um exemplo desse grupo de segurança. Portanto, os direitos de acesso para os membros dos Usuários de Domínio não estão disponíveis no Microsoft Entra ID. Mesmo que os usuários tenham acesso ao conteúdo local, eles não recebem resultados de pesquisa quando pesquisam esse conteúdo.

Em vez disso, atribua direitos de acesso usando um grupo que não tenha IsCriticalSecurityObject=true, por exemplo, o grupo Todos, o grupo Usuários Autenticados ou um grupo personalizado. Para obter uma lista das condições para excluir objetos e mais informações sobre resultados inesperados de sincronização, confira Um ou mais objetos não são sincronizados ao usar a ferramenta Sincronização do Azure Active Directory.

Sua organização tem conteúdo local confidencial?

Algumas organizações têm conteúdo local considerado confidencial devido a restrições regulatórias, legais ou geopolíticas. Em alguns casos, é proibido adicionar metadados de conteúdo local confidencial ao índice de pesquisa do Microsoft 365. Em outros casos, metadados de conteúdo local confidencial podem ser adicionados ao índice de pesquisa do Microsoft 365, mas apenas um número limitado de usuários pode abrir os resultados da pesquisa do conteúdo confidencial.

Aqui estão dois exemplos de como você pode configurar a pesquisa híbrida para atender a essas restrições:

Quando metadados de conteúdo local confidencial são permitidos no índice do Microsoft 365

Configure a pesquise híbrida na nuvem e planeje com cautela os direitos de acesso ao conteúdo confidencial para que apenas os usuários certos tenham acesso ao conteúdo confidencial ao selecionar um resultado de pesquisa.

Quando metadados de conteúdo local confidencial não são permitidos no índice do Microsoft 365

Configure a pesquisa híbrida na nuvem em combinação com pesquisa federada híbrida.

Imagem mostrando um configuração combinada da busca híbrida na nuvem, da pesquisa federada híbrida e do Enterprise Search.

  • Planeje fontes de conteúdo para o aplicativo de serviço Pesquisa de nuvem (SSA na nuvem) no SharePoint Server que abrangem todo o conteúdo local, exceto o conteúdo confidencial. Os metadados do conteúdo rastreado são adicionados ao índice de pesquisa no Office 365.

  • Planeje a pesquisa corporativa no SharePoint Server para rastrear o conteúdo local e confidencial, consulte Planejar pesquisa no SharePoint Server. Planeje fontes de conteúdo para o SSA que abrangem o conteúdo confidencial. Os metadados do conteúdo rastreado e confidencial são adicionados ao índice de pesquisa no SharePoint Server.

  • Se os seus usuários precisarem de resultados do índice de pesquisa do Microsoft 365 em sites do SharePoint locais, planeje uma pesquisa federada híbrida do SharePoint Server para exibir resultados de pesquisa do índice de pesquisa no SharePoint Server e do índice de pesquisa no Office 365, confira Planejar pesquisa federada híbrida para o SharePoint Server.

Planejar a validação da pesquisa híbrida na nuvem antes de expor aos seus usuários

Depois de criar e configurar o SSA de nuvem e concluir um rastreamento completo, o Centro de Pesquisa do Microsoft 365 mostra os resultados da pesquisa local e online. Recomendamos que você valide e ajuste a nova experiência de pesquisa em um Centro de Pesquisa separado, mantendo a experiência de pesquisa original inalterada.

Planeje uma fonte de resultado personalizada que limite seus Centros de Pesquisa em Office 365 para mostrar apenas o conteúdo do Microsoft 365. A ilustração a seguir mostra um ambiente em que você pode validar e ajustar como os resultados da pesquisa híbrida são mostrados:

Imagem mostrando como o conteúdo insere o índice do Office 365 de um farm de conteúdo do Microsoft SharePoint Server e do Microsoft 365.

  1. Conteúdo local. Durante o rastreamento, os metadados desse conteúdo são adicionados ao índice de pesquisa do Microsoft 365.

  2. Conteúdo do Microsoft 365. Durante o rastreamento, os metadados desse conteúdo são adicionados ao índice de pesquisa do Microsoft 365.

  3. Centro de Pesquisa do Microsoft 365 padrão (ou existente). Você cria uma fonte de resultado personalizada para este Centro de Pesquisa, que limita os resultados da pesquisa para mostrar apenas o conteúdo do Microsoft 365. .

  4. Novo Centro de Pesquisa do Microsoft 365, onde você valida e ajusta como os resultados da pesquisa híbrida são mostrados. Este Centro de Pesquisa usa a fonte de resultado padrão e mostra resultados de pesquisa de conteúdo local e do Microsoft 365. Você configurou o acesso para que apenas testadores e administradores tenham acesso a este site.

Observação

Embora você possa manter a experiência de pesquisa original inalterada durante o ajuste, você não pode manter a experiência original do Office Delve inalterada. Quando os metadados do conteúdo local estiverem no índice de pesquisa Office 365, o Delve exibirá esse conteúdo.

[Saiba mais sobre a pesquisa híbrida na nuvem do SharePoint no Microsoft 365] (learn-about-cloud-hybrid-search-for-SharePoint no Microsoft 365.md)

Configurar a pesquisa híbrida na nuvem – roteiro

Pesquisa híbrida no SharePoint