在 SharePoint Server 中启动、暂停、恢复或停止爬网

适用于:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

对某个内容源执行完全爬网时,会对由内容源指定的所有内容进行爬网(即使搜索索引中已经存在该内容)。 您可以对每个内容源分别启动完全爬网。 除非满足以下任一条件,否则单击"管理内容源"页上的"开始所有爬网"链接将导致使用增量爬网对所有内容源中指定的内容进行爬网:

  • 系统检测到需要完全爬网。

  • 内容源属于"SharePoint 网站"类型,并且在内容源的"添加/编辑内容源"页上的"爬网计划"部分选择"启用连续爬网"。 连续爬网是 SharePoint Server 中新的爬网计划选项,仅适用于 SharePoint 网站类型的内容源。

开始之前

在执行本文中的程序之前,服务器场中必须已存在搜索服务应用程序,以便您可以执行爬网。 有关详细信息,请参阅 在 SharePoint Server 2016 中创建和配置搜索服务应用程序。 搜索服务应用程序可以包含一个或多个内容源。 您执行的每次爬网与指定要爬网的内容的特定内容源关联。

启动、暂停、继续或停止对内容源进行爬网

从“管理内容源”页中,您可以启动、暂停、继续或停止对任何未启用连续爬网的内容源的爬网。

开始、暂停、恢复或停止对内容源的爬网

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在管理中心的"应用程序管理"部分,单击"管理服务应用程序"。

  3. 在"管理服务应用程序"页上的服务应用程序列表中,单击"Search Service 应用程序"。

  4. 在“搜索管理”页上的“爬网”部分,单击“内容源”

  5. 在“管理内容源”页上的内容源列表中,指向所需内容源的名称,单击箭头,然后单击以下菜单项之一。 (值更改时 ,“状态” 列中的值可能不会自动刷新。若要更新 “状态” 列中的值,请单击“ 刷新”来刷新“管理内容源”页。)

  • Start Full Crawl. The value in the Status column changes to Crawling Full for the selected content source.

  • Start Incremental Crawl. The value in the Status column changes to Crawling Incremental for the selected content source.

  • Resume Crawl. The value in the Status column changes back to Crawling Full or Crawling Incremental for the selected content source.

  • Pause Crawl. The value in the Status column changes to Paused for the selected content source.

    注意

    暂停爬网存在缺点,即对爬网组件的引用会留在搜索管理数据库中的 MSSCrawlComponentsState 表中。 如果您想删除任何爬网组件(例如,因为您想从服务器场中删除托管这些组件的服务器),这可能会导致问题。 但是,当您停止爬网时,对 MSSCrawlComponentsState 表中爬网组件的引用将被删除。 因此,如果您想删除爬网组件,最好停止爬网,而不是暂停爬网。 有关删除爬网组件的详细信息,请参阅 SharePoint Server 中爬网的最佳做法

  • Stop Crawl. You must click OK to confirm that you want to stop the crawl. The value in the Status column changes to Idle for the selected content source.

    注意

    如果您想停止进行中的完全爬网或增量爬网(例如,为了能够更改搜索拓扑),那么下次对该内容源进行爬网时,搜索系统将自动执行完全爬网。

禁用连续爬网

从“管理内容源”页,可以启用或禁用连续爬网,但无法暂停或继续连续爬网。 如果您要暂停当前正处于连续爬网模式中的内容源,请先禁用连续爬网。 有关详细信息,请参阅Manage continuous crawls in SharePoint Server