了解 Exchange 搜索

 

适用于: Exchange Server 2010 SP2, Exchange Server 2010 SP3

上一次修改主题: 2016-11-28

随着邮箱大小和以邮件和附件形式存储于邮箱中的数据量的不断增长,对用户来说,快速搜索和找到所需邮件非常重要。在 Microsoft Exchange Server 2010 中,您可以为您的用户设置个人存档,帮助您减少或消除对 .pst 文件的使用。 这会造成用户存储更多邮箱数据,并且,在用户的主要和存档邮箱中的搜索会成为重要的效率工具。

在 Exchange 2010 中,获得授权的用户可以使用“多邮箱搜索”在整个 Exchange 2010 组织内执行邮箱搜索,以配合电子发现 (eDiscovery) 请求、法规审核或内部调查。 “多邮箱搜索”也会使用 Exchange 搜索创建的内容索引。

Exchange 搜索与可在 Exchange Server 2003 中进行的全文索引不同。 性能、内容索引和搜索已得到改进。 几乎在新项目创建或发送到邮箱中的同时将对这些项目建立索引,这样,用户便可快速、稳定且更加可靠地搜索邮箱数据。 在 Exchange 2010 和 Exchange Server 2007 中,在所有邮箱数据库上都会默认启用内容索引,且不需要任何初始设置或配置。

注释注意:
Exchange 搜索不会对公用文件夹数据库建立索引。

目录

内容索引

Exchange 搜索性能

Exchange 搜索客户端

高级查询语法

Exchange 搜索和附件

针对 Exchange Server 2003 内容索引的改进

Exchange 搜索和 Exchange Store 搜索之间的差异

Exchange 搜索和本地化

Exchange 搜索和数据库可用性组

内容索引

在启动“Exchange 搜索”服务后,Exchange 搜索会确定邮箱服务器上所有邮箱数据库的搜索状态。 如果装入了邮箱数据库,并允许进行搜索,Exchange 搜索将为其分配以下状态值之一:

  • 新建   当邮箱数据库的状态为“新建”时,Exchange 搜索会为此数据库创建内容索引。 在创建内容索引后,Exchange 搜索会将数据库的状态更改为“爬网”。

  • 爬网   当邮箱的状态为“爬网”时,Exchange 搜索会对数据库中的邮箱建立索引。 在数据库中的所有邮箱均建立索引前,状态将一直保持为“爬网”。 数据库中的所有邮箱均建立索引后,Exchange 搜索会将数据库的状态更改为“通知”。

  • 通知   数据库上发生第一次爬网后,Exchange 存储将通知 Exchange 搜索发生了如邮件创建、发送或删除这样的新事件。 事件会被添加到通知队列以建立索引。 添加过程非常迅速,因此内容索引的过期时间绝不会超过数分钟。 在将新邮件发送到邮箱后的数秒内,就会将这些邮件建立索引。

返回顶部

Exchange 搜索性能

相较于 Exchange 2003 中的全文索引,Exchange 搜索显著提高了性能。 搜索模式已从爬网模式更改为始终最新模式。 对系统资源(如 CPU、内存、磁盘 I/O 以及索引所需的磁盘空间)也作出了数项改进。 由于性能上的这些提高,索引建立速度也有超过 35 倍的提高。 尽管数据库的完全爬网更为快速,它可能会使用邮箱服务器上的大量资源,具体取决于邮箱数据库的大小。 在对资源的使用更为集中的阶段,可能会中断邮件流。 由于邮件的传递应按内容索引的优先级进行,在 Exchange 搜索中提供的新限制功能会自动限制特定邮箱数据库或数据库集的索引,从而减少磁盘 I/O 并降低 CPU 使用率。

返回顶部

Exchange 搜索客户端

Exchange 搜索提供了一个供搜索客户端使用的服务。 这些客户端包括 Microsoft Outlook、Microsoft Office Outlook Web App、Windows Mobile、Exchange 2010 中的多邮箱搜索功能和 Exchange Web 服务。

在 Outlook 2010 和 Office Outlook 2007 中,Outlook 配置文件用于在可配置为使用缓存 Exchange 模式的计算机上配置 Outlook 功能。 当 Outlook 以联机模式连接到 Exchange 并访问 Exchange 邮箱时,在邮箱服务器上将发生更改,例如创建邮箱邮件、创建新邮件和删除邮箱邮件等。 在缓存 Exchange 模式下,Outlook 会在用户计算机上创建 Exchange 邮箱的本地副本。 此副本存储在用户配置文件中的 .ost 文件中。 对本地副本邮箱中邮件进行更改之后,这些更改会与 Exchange 邮箱同步。 有关缓存 Exchange 模式的详细信息,请参阅 关于缓存 Exchange 模式

在缓存 Exchange 模式下,Outlook 会使用 Windows 搜索,它是 Windows 7 和 Windows Vista 中的内置组件。 Windows 搜索会执行内容索引建立操作,并向 Outlook 提供搜索功能。 正在缓存 Exchange 模式下运行的 Outlook 用户可通过本地内容索引和搜索服务的连接更高效地搜索他们的邮箱。 除对脱机存储中的电子邮件建立索引外,Windows 搜索还会对文件系统中的其他数据建立索引。 有关 Windows 搜索的详细信息,请参阅 Windows 搜索

Outlook 2010 和 Outlook 2007 向您的用户提供了一个方便使用的“即时搜索”框,此框位于邮件列表窗格的顶部,因此您的用户可以快速地对邮箱内容进行搜索。 此外,使用“高级查找”功能,用户可以通过使用多个字段和参数创建更为复杂的搜索查询。

返回顶部

高级查询语法

随着用户接收的电子邮件消息数量的不断增长,邮箱越来越大,结果信息将会超载,如能快速搜索电子邮件,则可以提高用户工作效率并提高对电子邮件的满意度。 通过使用高级查询语法 (AQS),用户可以快速地创建高级搜索查询并找到他们所需的邮件。 AQS 搜索查询可以在 Outlook 中的“即时搜索”框中直接输入。

例如,要搜索由用户 April Stewart 发送的、带有附件并在主题字段中包含 Contoso 单词的邮件,用户可以使用以下搜索查询: From:"April Stewart" HasAttachments:true Subject:Contoso。要将查询进一步缩小为未读邮件,用户可以添加以下关键字和值: unread:true。要将查询进一步缩小为 April 在上个月发送的邮件,用户可以添加以下关键字和值: Sent:lastmonth

服务器上的 Exchange 搜索和桌面上的 Windows 搜索均支持 AQS。 使用 AQS 的搜索查询在联机和缓存模式下的 Outlook 2010 和 Outlook 2007 中均能使用。 在 Exchange 2010 中,用户还可以在 Outlook Web App 和 Windows Mobile 中使用 AQS 查询。 Exchange 搜索客户端(例如多邮箱搜索)也支持 AQS 搜索查询。

Outlook 2010 和 Outlook 2007 支持大量 AQS 关键字。 此外,Exchange 搜索还支持下表所示的关键字。

Exchange 搜索关键字

属性 示例 搜索结果

附件

attachment:annualreport.pptx

包含名为 annualreport.ppt 的附件的邮件。使用 attachment:annualreport 或 attachment:annual* 将返回与使用附件完整名称相同的结果。

抄送

cc:paul shen

cc:pauls

cc:pauls@contoso.com

“抄送”字段为 Paul Shen 的邮件

发件人

from:bharat suneja

from:bsuneja

from:bsuneja@contoso.com

由 Bharat Suneja 发送的邮件。

保留策略中的关键字

retentionpolicy:business critical

应用了 Business Critical 保留标记的邮件。

根据策略而定的邮件过期日期

expires:4/1/2010

在 2010 年 4 月 1 日过期的邮件。

发送时间

sent:yesterday

昨天发送的所有邮件。

主题

Subject:"patent filing"

“主题”字段中出现有短语“patent filing”的所有邮件。

收件人

to:"ben smith"

to:bsmith

to:besmith@contoso.com

“收件人”字段中为 Ben Smith 的消息。

返回顶部

Exchange 搜索和附件

Exchange 搜索会将电子邮件附件中包含的文本内容建立索引。 为使用搜索筛选器,Exchange 搜索提供了不同文件格式支持。 Exchange 安装程序默认情况下会安装多种搜索筛选器,支持对多种常用文件格式建立索引,其中包括 Microsoft Office 文件。 有关由 Exchange 安装程序安装的搜索筛选器的列表,请参阅Exchange 搜索的默认筛选器。 您可以为您想要 Exchange 搜索建立索引的文件格式安装附加搜索筛选器。 可从许多合作伙伴和第三方处获取不同文件格式的搜索筛选器。 以下内容可建立索引:

  • 不可搜索的项目   当 Exchange 搜索因在邮箱服务器上未安装某种文件格式的相应搜索筛选器而无法对该格式的文件建立索引时,会将此项目视为不可搜索的项目。 也可能由于其他原因将项目标记为不可搜索。 通过使用 Get-FailedContentIndexDocuments cmdlet,您可以针对每个邮箱、邮箱数据库或邮箱服务器检索不可搜索项目的列表。 有关详细信息,请参阅诊断 Exchange 搜索问题。 在使用多邮箱搜索执行发现搜索时,不可搜索项目也可包含在内。

  • 安全列表   对于某些文件类型,将视其为不包含 Exchange 搜索可建立索引的内容。 通过在注册表中创建空筛选器值,可以将这些文件类型添加到安全列表。 Exchange 安装程序会为多个文件类型创建空筛选器注册表值。 包含这些文件类型的邮箱邮件不会返回到“无法搜索的项目”列表中。有关默认搜索筛选器和默认空筛选器条目的列表,请参阅Exchange 搜索的默认筛选器

  • 加密的项目   Exchange 搜索不会将使用 S/MIME 加密的邮件建立索引。 如果您使用 Get-FailedContentIndexDocuments cmdlet,加密的邮件将作为不可搜索的项目返回。

  • 受 IRM 保护的项   使用信息权限管理 (IRM) 保护的邮件会由 Exchange 搜索建立索引,并包含于搜索结果中。 邮件必须使用 Active Directory 权限管理服务 (AD RMS) 服务器进行保护,此服务器应与 Exchange 2010 邮箱服务器处于同一 Active Directory 林中。 有关详细信息,请参阅权限保护

注释注意:
在缓存 Exchange 模式下,附件也会由 Windows 搜索建立索引。 Windows 搜索会使用安装在用户计算机上的搜索筛选器。

返回顶部

针对 Exchange Server 2003 内容索引的改进

在 Exchange 2003 中,Exchange 中的搜索功能(内容索引)已不再使用,取而代之的是 Exchange 2010 搜索。 Exchange 搜索针对内容索引提供了以下特性和功能改进:

  • 系统资源(如 CPU、内存、磁盘 I/O 以及其索引所需的磁盘空间)的利用率得到了改进,从而显著提高了总体性能。

  • 新邮件通常在到达后的 10 秒内编入索引,并会在数秒内返回查询结果。

  • 安装时自动启用 Exchange 搜索,无需任何配置。

  • 附件现在可以编入索引。 支持多种附件类型,包括 Microsoft Office 文档、文本附件和 HTML 附件。

  • 对特定邮箱数据库自动停止索引,从而降低了磁盘 I/O 负载。 另外,对整个邮箱服务器自动停止索引,从而降低了 Exchange 搜索的磁盘 I/O 和 CPU 利用率。

  • Outlook Web App 中有一个操作方便的搜索条,Outlook 2010 和 Outlook 2007 中支持查询生成器。

返回顶部

Exchange 搜索和 Exchange Store 搜索之间的差异

Exchange 搜索通过使用预先生成的索引,允许您在邮件中快速搜索文本。Exchange 存储搜索基于对搜索范围内的所有邮件进行的顺序扫描,而不是使用预先生成的索引。下表对 Exchange 搜索和 Exchange 存储搜索之间的部分不同点进行了比较。

Exchange 搜索与 Exchange 存储搜索

Exchange 搜索 Exchange 存储搜索

较快

较慢

搜索通过对邮箱数据库进行爬网而创建的内容索引

搜索存储

在新项目创建或传递到邮箱中的数秒内对这些项目建立索引

可能不会返回较新的邮件

使用字词、短语和句子,忽略标点符号和空格,不区分大小写

搜索字节流,仅查找完全匹配项

仅支持前缀搜索,不支持子字符串匹配项

支持子字符串匹配项

使用可用的搜索筛选器搜索附件

不会在附件中搜索

可以用不同的语言来搜索邮件

非感知语言

返回顶部

Exchange 搜索和本地化

对 Exchange 搜索的本地化支持受限于客户端区域设置与邮件区域设置(它还必须匹配邮件正文所用的语言)匹配的方案。 Exchange 搜索不支持单封邮件在邮件正文中嵌入多种语言或客户端区域设置与邮件区域设置不同的实例。

要对本地化搜索获得一致结果,必须满足以下条件:

  • 必须使用单一语言编写电子邮件,并且该语言必须匹配邮件的区域设置。

  • 搜索表达式必须使用单一语言表示。

  • 该语言必须与客户端计算机的区域设置(它由与服务器之间的连接标识)匹配。

返回顶部

Exchange 搜索和数据库可用性组

在具有数据库可用性组 (DAG) 的组织中,在种子设定过程中,具有被动邮箱数据库副本的 DAG 成员会从具有活动邮箱数据库副本的 DAG 成员复制内容索引编录。 内容索引通常为邮箱数据库大小的 10%。 在初始种子设定之后,具有被动数据库副本的服务器会从具有活动数据库的服务器获取邮件数据,并在本地对内容进行索引。 用于复制进行索引的邮件内容的带宽独立于用于复制事务日志的带宽。 在规划高可用性部署时,必须考虑 Exchange 搜索使用的带宽。

Exchange 2010 邮箱服务器角色要求计算器在计算 DAG 中的内容索引所需的带宽时会包括内容索引考虑因素。有关该计算器的详细信息(包括用于下载该计算器的链接),请参阅 Exchange Server 团队博客文章 Exchange 2010 邮箱服务器角色要求计算器

若要了解有关 DAG 的详细信息,请参阅了解数据库可用性组

 © 2010 Microsoft Corporation。保留所有权利。