SharePoint 的云混合搜索计划
**上一次修改主题:**2017-12-05
设置SharePoint云混合搜索需要仔细规划。这篇文章可以帮助您设计高度可靠、 安全、 可扩展的云混合搜索解决方案。
搜索遇到执行您的用户需要吗?
当您设置了云混合搜索和内部内容的完全爬网完成后,在Office 365的搜索中心自动显示混合从Office 365索引的结果。
您的用户需要其他类型的搜索吗?
搜索行业的搜索行业范围缩小到一组特定的内容,例如要显示只有视频的搜索结果。如果您当前使用的是在SharePoint Server中搜索中心垂直搜索,您必须在SharePoint Online在Office 365搜索中心中重新创建它。
网站搜索— 在SharePoint Server中的文档库中现有的搜索将停止搜索索引移到Office 365时返回结果。当用户使用搜索中心,都在同一环境中作为搜索索引,因此从Office 365搜索中心搜索提供了更好的体验,搜索是快的。如果您的用户需要从内部部署 SharePoint 网站中的Office 365搜索索引的结果,如在现有工作组网站中SharePoint Server 2010,您可以设置搜索从SharePoint Server 2013或SharePoint Server 2016。计划在SharePoint Server 2013或SharePoint Server 2016 , Office 365搜索索引中获取结果的远程结果源和计划使用的查询联盟。因为SharePoint OnlineOffice 365查询,您的用户必须使用查询语法的过程中, SharePoint Online支持。了解更多在在具有云混合搜索功能的本地 SharePoint 中显示 Office 365 的结果中。
eDiscovery – 您可能需要设置 eDiscovery 分别在SharePoint Server和SharePoint Online在Office 365中。
跨网站发布-跨网站发布不可用于云混合搜索。
要显示搜索结果如何?
预览-当用户悬停搜索结果来自Office 365,信息内容,以及内容的预览将显示。来自内部的搜索结果中的内容有关的信息,将自动显示,但您必须设置此内容的预览的显示。规划 Office Web 应用程序服务器场和配置SharePoint Server 2013使用 Office Web 应用程序服务器。了解如何在在具有云混合搜索功能的本地 SharePoint 中显示 Office 365 的结果中的。
自定义安全修整- SharePoint OnlineOffice 365中不支持自定义的安全修整。
您的搜索功能是否需要?
您可能熟悉SharePoint Server的搜索功能有不同的作用与云混合搜索。打算向用户介绍有关的差异。
最佳匹配的最佳匹配是一个SharePoint Server 2010功能。而在SharePoint Online在Office 365中使用查询规则。
自定义搜索范围的自定义搜索范围是SharePoint Server 2010的功能。改为使用在SharePoint Online在Office 365的结果来源。
升级/降级的搜索结果-升级/降级的搜索结果是一个SharePoint Server 2010功能。改为使用在SharePoint Online在Office 365的结果来源。
删除本地搜索结果-在管理中心中SharePoint Server可以选择搜索服务应用程序,并使用"索引重置"选项从搜索索引中移除所有项。不要将此选项用于搜索服务应用程序的云,选项删除爬网历史记录从爬网的数据库,但不在部署项目从索引中删除Office 365因为没有云搜索之间的直接通信SharePoint Server和Office 365中的搜索索引中的服务应用程序。这些内部项目成为了Office 365索引中的孤立。如果要从 Office 365 提供搜索索引中删除所有的内部元数据,则删除所有内部内容源。左侧的任何内部项目 Office 365 提供搜索索引中完成此过程后,是孤立项。
一些您可能熟悉SharePoint Server的搜索功能将不可用的云混合搜索。若要向用户的计划。
多租户场上SharePoint Server 2013或SharePoint Server 2016 - SharePoint Server 2013或SharePoint Server 2016场只能附加一个租户SharePoint Online在Office 365中,因此SharePoint Online不能保留多租户SharePoint Server 2013 的租户隔离或SharePoint Server 2016场。
自定义实体提取的自定义实体提取不随云混合搜索,因为SharePoint OnlineOffice 365中不支持自定义实体提取。
由于SharePoint Online在Office 365中不支持自定义实体提取内容的丰富化 web 服务的内容的丰富化的 web 服务调用出不可用云混合搜索。
同义词库的同义词库不可用云混合搜索,因为SharePoint OnlineOffice 365在不支持同义词库。
计划云混合搜索在 SharePoint 服务器您搜索体系结构
当您设置了云混合搜索时,步骤之一是创建一个群搜索服务应用程序 (云 SSA) 在SharePoint Server 2013或SharePoint Server 2016搜索服务器场。当您创建此云 SSA 时,默认搜索体系结构是为您创建运行云 SSA 的服务器上。每个搜索服务器场可以只有一个云 SSA,但可以有多个 Ssa 云 SSA 与结合。
对于云的混合搜索搜索体系结构包含搜索组件和数据库,形成一种拓扑,并主持该拓扑结构的服务器。您需要计划的爬网组件为您的拓扑结构的服务器来承载搜索组件和数据库,并为每个服务器所需的硬件数量。
您开始之前,应阅读了解云混合搜索的搜索拓扑来熟悉云混合搜索的搜索体系结构中的搜索组件。
步骤 1: 内部内容的数量可以索引中Office 365?
在SharePoint Online中有您的租户共用的存储空间每个 1 tb,可以索引 1 百万项的内部Office 365搜索索引中的内容。您可以购买更多空间来增加配额,直到它达到 20 多万项目的阈值。如果需要索引的内部内容的 20 多万项,请与Microsoft 支持来提高此阈值。
步骤 2: 我需要什么大小云中搜索体系结构
对于云的混合搜索建议使用默认搜索体系结构创建云 SSA 时获取:
灰色的组件处于非活动状态在云混合搜索,但他们仍需要放置在服务器上,如所示。阅读了解云混合搜索的搜索拓扑中的非活动组件。
如同内部唯一的企业级搜索,您可以扩展您的搜索体系结构。二者的主要区别在于云混合搜索仅相关来调整爬网组件。如果您需要调整爬网,请按照在 SharePoint 2016 中针对特定性能要求重新设计企业级搜索拓扑中的爬网的指南 (用于爬网的指南也适用于云混合搜索)。请注意,是否在高速的内部内容进行爬网,系统可能会限制喂养到Office 365搜索索引来保护Office 365租赁。如果您的搜索体系结构有最多两个爬网组件,这应导致足够的和可接受的爬网率。
步骤 3: 什么硬件要求我应该知道的云中搜索体系结构?
选择要运行服务器物理或虚拟云混合搜索
我们建议使用虚拟机的搜索体系结构,但您还可以使用物理计算机。了解在选择物理或虚拟运行服务器的详细信息。
选择云混合搜索主机服务器的硬件资源
下表显示每个应用程序服务器或数据库服务器所需的硬件资源的最小金额:
服务器 | 位于主机 | 存储 | RAM | Processor1 |
---|---|---|---|---|
应用程序服务器 |
A |
100 GB |
16 GB |
1.8 GHz 4x CPU 内核 |
数据库服务器 |
B |
100 GB |
16 GB |
1.8 GHz 4x CPU 内核 |
1此处特指 CPU 内核数,而不是 CPU 线程数。
除了以上:
请确保每台主机服务器具有足够的磁盘空间用于基本安装的 Windows 服务器操作系统和SharePoint Server程序文件。主机服务器还需要可用硬盘空间用于诊断日志记录,调试,例如,对日常操作,和页面文件创建内存转储。通常情况下,80 GB 的磁盘空间已足够用于 Windows 服务器操作系统和SharePoint Server程序文件。
添加每个数据库服务器 SQL 日志空间的存储。如果没有设置数据库服务器,经常备份数据库,SQL 日志空间使用大量存储。有关如何计划 SQL 数据库的详细信息,请参阅存储和 SQL Server 容量规划与配置 (SharePoint Server)。
计划云混合搜索的存储性能
对于在存储空间内分布来自搜索组件和操作系统的数据,您所决定的方式会影响搜索性能。比较好的做法是:
将 Windows Server 操作系统文件、 SharePoint Server程序文件和诊断日志拆分跨三个独立的存储卷或分区的正常性能。
存储高性能的独立存储卷或分区上的搜索组件数据。
提示
当您在主机上安装 SharePoint Server 时,您可以为搜索组件数据设置一个自定义位置。需要存储数据的主机上的任何搜索组件将数据存储在此位置。稍后要更改此位置,必须在该主机上重新安装 SharePoint Server。
请确保您有存储有足够的速度来处理从搜索组件和数据库的通信。爬网数据库是云的 IOPS 要求的混合搜索的搜索体系结构中是唯一的组件。爬网数据库,需要对高 IOP,媒体和 I/O 子系统的典型负荷为 1 文档每秒 (DPS) 爬网速率每 10 个 IOPS。
了解云混合搜索的搜索拓扑
搜索拓扑结构的云 SSA 包含搜索组件和数据库的类型与在SharePoint Server 2013或SharePoint Server 2016的标准 SSA 的搜索拓扑相同。但有一些差异。
未使用搜索组件和数据库在云混合搜索-在云混合搜索,是Office 365的处理内容、 索引、 存储和处理分析。SSA 云不使用自己处理组件、 索引组件、 分析处理组件、 链接的数据库或分析数据库的内容。这些组件和数据库均处于空闲状态。
搜索组件和云混合搜索中的数据库之间的交互的搜索组件和数据库的云 SSA 相较于标准的 SSA 的搜索拓扑搜索拓扑中以不同的方式相互作用:
爬网组件从内部场获取内容并将其发送内容到Office 365中的搜索索引。它使用连接器进行交互的内容源和爬网数据库,用于存储临时和历史有关的项目信息搜寻,就像常规的爬网组件。
搜索管理组件运行至关重要,若要搜索,如同标准 SSA 的系统进程。
我们建议从Office 365,运行所有搜索作为云混合搜索优化此。但是,您可以设置在SharePoint Server站点搜索以获取从搜索索引中Office 365的搜索结果。如果将在内部网站集搜索设置为Office 365索引的查询,此查询处理组件通过查询从搜索框中为Office 365的索引,并通过Office 365索引的搜索框结果。
确定如何管理内部内容的爬网
您可以通过如何管理爬网,请如通过有效地使用内容来源,安排进行爬网,爬网规则影响爬网性能和搜索的新鲜。管理爬网的指南内部仅搜索同样适用于群混合搜索,请参阅Best practices for crawling in SharePoint Server。
决定如何同步活动目录
当内部内容爬网,分析和加密时,每一项的访问控制列表 (Acl) 爬过网。Office 365搜索索引存储的 Acl 项,以及因此需要系统能够识别为同一个人在Office 365的内部用户。当您设置了 Active Directory 同步您的内部网络 (Windows 服务器 Active Directory) 和您Office 365租户 (Windows Azure Active Directory) 之间时,系统映射,并转换为适当的用户中,Acl 和用户获得安全修整从Office 365索引的搜索结果。
有两种方法来同步活动目录:
带有密码同步的目录同步
带有单一登录 (SSO) 的目录同步
如果您选择的 SSO 选项,您还可以配置密码同步如果要作为备份的 SSO,但您必须配置至少两个 (密码同步或 SSO)。了解详细信息以及如何在Office 365 与内部环境的集成配置的两种方法。
为什么用户不能混合云混合搜索结果时,其域用户安全组的成员?
一些组织使用的默认安全组之一在 Windows 服务器活动目录 (AD),例如域用户安全组分配到其内部内容的访问权限。
默认情况下该 Azure 活动目录连接同步工具从同步中排除某些对象。安全组具有属性 IsCriticalSecurityObject = 真是一套工具排除,对象和域用户是一种安全组。因此,成员的域用户的访问权限不可用在 Azure 活动目录 (AAD)。即使用户有权访问内部内容,它们没有得到搜索结果,当他们搜索的内容。
相反,通过使用没有 IsCriticalSecurityObject 组分配访问权限 = true,例如所有人组、 经过身份验证的用户组中或自定义组。不包括对象和意外的同步结果的更多信息的条件列表,请参阅使用 Azure 活动目录同步工具时不同步的一个或多个对象。
您的组织是否有敏感的内部内容?
一些组织的管理法规、 法律或地缘政治约束被认为敏感的内部内容。在某些情况下,这种行为将元数据与敏感的内部部署内容添加到Office 365搜索索引。在其他情况下,可以将与敏感的内部部署内容的元数据添加到Office 365搜索索引,但仅有限的数量的用户可以打开搜索结果从敏感的内容。
下面是如何可以设置混合搜索以遵守这些约束的两个示例:
当Office 365索引中允许从敏感,内部内容的元数据
设置,当用户选择的搜索结果,因此只有适当的用户云混合搜索和仔细计划的机密内容的访问权限获取对敏感内容的访问。
从敏感,内部内容的元数据的Office 365索引中不允许使用时
设置云混合搜索结合混合联合搜索。
计划涵盖了所有的内部内容,除了敏感内容云搜索服务应用程序 (云 SSA) 在SharePoint Server中的内容源。已爬网内容的元数据是在Office 365中添加搜索索引。
计划在SharePoint Server敏感,内部内容爬网,请参阅在 SharePoint Server 中规划搜索中的企业搜索。对于涉及敏感内容的 SSA 计划内容源。从已爬网、 敏感内容的元数据添加到SharePoint Server中的搜索索引中。
如果您的用户需要从Office 365搜索索引中内部部署 SharePoint 网站, SharePoint ServerOffice 365,在显示从SharePoint Server中的搜索索引和搜索索引的搜索结果从计划联合的混合搜索结果,请参阅Plan hybrid federated search for SharePoint Server。
要验证之前将其公开给用户的云混合搜索计划
您创建并设置云 SSA 并完成完全爬网后,您Office 365搜索中心显示了内部部署和联机搜索结果。我们建议您验证和调整单独的搜索中心,在新的搜索体验,同时保持原始搜索体验保持不变。
规划限制在Office 365您搜索中心,以便只显示Office 365内容的自定义结果源。下面的插图显示了一个环境,您可以验证,并调整混合搜索结果的显示方式:
内部部署的内容。在爬网,从该内容的元数据添加到Office 365搜索索引中。
Office 365的内容。在爬网,从该内容的元数据添加到Office 365搜索索引中。
默认 (或现有的) Office 365的搜索中心。创建此搜索中心,从而限制搜索结果以显示只有Office 365内容的自定义结果源。.
新Office 365搜索中心,您验证并调整混合搜索结果的显示方式。此搜索中心使用默认结果源,并显示搜索结果从内部部署和Office 365的内容。因此只有测试人员和管理员有权访问此站点设置访问权限。
备注
尽管可以保持不变时调整原始搜索体验,不能保持不变的原始Office Delve体验。Office 365在搜索索引中元数据的内部内容时, Delve将显示此内容。