Condividi tramite


Filtri IFilter e gestori di protocollo (Office SharePoint Server 2007)

Il crawler in Microsoft Office SharePoint Server 2007 utilizza i gestori di protocollo per accedere al contenuto e quindi alcuni filtri IFilter per estrarre contenuto dai file sottoposti a ricerca per indicizzazione. I filtri IFilter consentono di rimuovere la formattazione specifica dell'applicazione prima che il motore indicizzi il contenuto di un documento. In Microsoft Office SharePoint Server 2007 vengono sottoposti a ricerca per indicizzazione solo i tipi di file per cui sono installati un gestore di protocollo e un filtro IFilter.

In questa sezione vengono descritti i filtri IFilter e i gestori di protocollo inclusi per impostazione predefinita in un'installazione di Microsoft Office SharePoint Server 2007 e viene illustrato come installare e registrare ulteriori filtri IFilter e gestori di protocollo.

Il crawler utilizza i gestori di protocollo e i filtri IFilter nel modo seguente.

  1. Il crawler recupera gli indirizzi iniziali delle origini di contenuto e chiama il gestore di protocollo in base al prefisso dell'URL.

  2. Il gestore di protocollo si connette all'origine di contenuto, quindi estrae i metadati a livello di sistema e le informazioni relative agli elenchi di controllo di accesso.

  3. Il gestore di protocollo identifica il tipo di file di ogni elemento di contenuto, in base all'estensione del file, e chiama il filtro IFilter appropriato associato a tale tipo di file.

  4. Il filtro IFilter estrae il contenuto, rimuovendo l'eventuale formattazione incorporata, e quindi recupera i metadati dell'elemento di contenuto.

  5. Il contenuto viene analizzato da uno o più word breaker specifici della lingua e viene aggiunto all'indice del contenuto, denominato anche indice full-text. I metadati e gli elenchi di controllo di accesso vengono aggiunti al database di ricerca.

Contenuto della sezione:

Vedere anche

Concetti

Aggiungere origini di contenuto (Office SharePoint Server 2007)