准备对内容进行爬网 (Search Server 2008)
更新时间: 2009年4月
应用到: Microsoft Search Server 2008
上一次修改主题: 2009-07-08
提示
除非另有说明,否则本文中的信息对 Microsoft Search Server 2008 和 Microsoft Search Server 2008 Express 均适用。
在编制索引的过程中,爬网程序将访问和读取内容项。从这些文件提取信息的过程将生成一个内容索引和一个搜索数据库,内容索引位于索引服务器的文件系统中,而搜索数据库位于由 Search Server 2008 使用的数据库中。用户搜索查询将针对此内容索引和搜索数据库运行。本节中的文章介绍爬网程序使用的默认设置,以及您可以通过哪些方式来帮助执行爬网过程和为用户生成更好的搜索结果。
添加内容源 (Search Server 2008)。内容源定义要爬网的内容、如何访问此内容以及对该内容进行爬网时的行为。
关于内容源 (Search Server 2008)。您可以指定用于定义何时对内容进行爬网以及定义爬网行为的设置,例如,网站内的爬网深度或所允许的服务器跃距数量。
IFilter 和协议处理程序 (Search Server 2008)。Search Server 安装了可读取一组特定文件类型并对其编制索引的功能。可以通过安装和注册更多 IFilter 来扩大这一初始文件类型列表。