Condividi tramite


Pianificare la ricerca per indicizzazione e la federazione in SharePoint Server

 

**Si applica a:**SharePoint Server 2013, SharePoint Server 2016

**Ultima modifica dell'argomento:**2018-03-06

Sintesi: pianificare la ricerca per indicizzazione o la federazione per la ricerca in SharePoint Server 2016 e SharePoint Server 2013.

Prima che gli utenti possano eseguire ricerche in SharePoint Server, è necessario effettuare la ricerca per indicizzazione o attuare la federazione del contenuto che si vuole rendere disponibile per la ricerca. Quando si effettua la ricerca per indicizzazione del contenuto, il servizio di ricerca crea un indice di ricerca su cui gli utenti possono eseguire query (richieste di ricerca). È anche possibile configurare il sistema di ricerca in modo da visualizzare i risultati di un provider esterno, ad esempio Bing, oltre a quelli dell'indice di ricerca locale. Il processo di recupero dei risultati della ricerca da un provider esterno e della visualizzazione dei risultati in locale si chiama federazione.

Contenuto dell'articolo:

  • Pianificare le origini contenuto

    • Pianificare la ricerca per indicizzazione di tipi di contenuto diversi

    • Eseguire la ricerca per indicizzazione del contenuto con pianificazioni diverse

    • Motivi per cui eseguire una ricerca per indicizzazione completa

    • Limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione

    • Pianificare i connettori

    • Pianificare regole di ricerca per indicizzazione per ottimizzare le ricerche per indicizzazione

    • Pianificare l'autenticazione del crawler

  • Pianificare l'elaborazione del contenuto

    • Includere o escludere tipi di file

    • Pianificare l'utilizzo di estrattori di entità (personalizzati)

  • Informazioni su risultati della ricerca e federazione

Pianificare le origini contenuto

Un'origine contenuto è una definizione di un gruppo di impostazioni di ricerca per indicizzazione, ad esempio su quali host effettuarla, per quale tipo di contenuto (contenuto di SharePoint o condivisioni file), in base a quale pianificazione e con quale livello di profondità.

Quando si crea un'applicazione del servizio di ricerca, quest'ultima fornisce automaticamente l'origine contenuto preconfigurata Siti di SharePoint locali. È possibile utilizzare questa origine contenuto per specificare come effettuare la ricerca per indicizzazione di tutto il contenuto di SharePoint nelle applicazioni Web associate all'applicazione del servizio di ricerca.

Se è presente un solo tipo di contenuto (ad esempio, tutto il contenuto è di tipo siti di SharePoint o condivisioni file), potrebbe essere necessaria un'unica origine contenuto. Se invece esistono diversi tipi di contenuto o requisiti specifici per ogni host, è consigliabile definirne più di una. Pianificare la creazione di altre origini contenuto quando è necessario:

  • Effettuare la ricerca per indicizzazione di diversi tipi di contenuto, ad esempio condivisioni file e dati in un'applicazione line-of-business

  • Effettuare la ricerca per indicizzazione di contenuto con pianificazioni diverse rispetto ad altri contenuti

  • Limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione

  • Impostare priorità diverse per la ricerca per indicizzazione in siti diversi

  • Mantenere alcuni tipi di contenuto più aggiornati rispetto ad altri

È possibile creare un numero elevato di origini contenuto in ogni applicazione del servizio di ricerca, ma esiste un sovraccarico associato a ogni origine contenuto. Pertanto, si consiglia di creare il minor numero possibile di origini di contenuti per soddisfare gli altri requisiti operativi, ad esempio le differenze di pianificazione e priorità per le ricerche per indicizzazione. Ogni origine contenuto può contenere fino a 100 indirizzi iniziali.

Pianificare la ricerca per indicizzazione di tipi di contenuto diversi

Per ogni origine contenuto è possibile effettuare la ricerca per indicizzazione di un solo tipo di contenuto. È ad esempio possibile creare un'origine contenuto che includa gli indirizzi iniziali dei siti di SharePoint e un'altra che includa quelli delle condivisioni file, ma non è possibile creare una singola origine contenuto contenente gli indirizzi iniziali sia di siti di SharePoint sia di condivisioni file. La tabella seguente elenca i tipi di origini contenuto che è possibile configurare.

Usare questo tipo di origine contenuto Per questo contenuto

Siti di SharePoint

Siti di SharePoint della stessa farm o di farm di SharePoint Server diverse.

Siti di SharePoint della stessa farm o di farm di SharePoint Server 2013, SharePoint Server 2010, SharePoint Foundation 2010 o Microsoft Search Server 2010 diverse.

Siti di SharePoint della stessa farm o di farm di Office SharePoint Server 2007, Windows SharePoint Services 3.0 o Search Server 2008 diverse.

Siti Web

Altro contenuto Web dell'organizzazione non incluso in siti di SharePoint.

Contenuto presente in siti Web in Internet.

Condivisioni file

Contenuto nelle condivisioni file dell'organizzazione.

Nota sulla sicurezzaSecurity
Quando il servizio di ricerca effettua la ricerca per indicizzazione in una condivisione file, se le autorizzazioni per un file della condivisione sono diverse da quelle delle cartelle in cui è contenuto, le autorizzazioni per il file hanno la precedenza e vengono usate per la limitazioni dei risultati della ricerca per motivi di sicurezza. Pertanto, per assicurarsi che nei risultati della ricerca vengano visualizzati solo gli elementi appropriati, verificare che le autorizzazioni per i file nelle condivisioni file siano appropriate. Nei casi in cui non siano appropriate, è possibile eliminare determinati elementi dall'indice di ricerca o dai risultati della ricerca. Per altre informazioni, vedere Delete items from the search index or from search results in SharePoint Server.

Cartelle pubbliche di Exchange

Cartelle pubbliche di Exchange 2007 ed Exchange Server 2010.

Lotus Notes

Messaggi di posta elettronica archiviati nei database di Lotus Notes.

Nota

A differenza di tutti gli altri tipi di origini contenuto, l'opzione relativa a un'origine contenuto Lotus Notes non viene visualizzata nell'interfaccia utente finché non viene installato e configurato il software prerequisito appropriato. Per altre informazioni, vedere Configure and use the Lotus Notes connector for SharePoint Server (applicabile anche a SharePoint Server).

Documentum

Contenuto del sistema EMC Documentum.

Nota

Per eseguire la ricerca per indicizzazione del contenuto di EMC Documentum, è prima necessario installare e configurare il software prerequisito appropriato e Il connettore di indicizzazione Microsoft SharePoint 2016 per Documentum. Per altre informazioni, vedere Configure and use the Documentum connector in SharePoint Server (applicabile anche a SharePoint Server).

Dati line-of-business

Dati business archiviati in applicazioni line-of-business.

Archivio personalizzato

Origini contenuto che possono essere sottoposte a ricerca per indicizzazione solo dopo l'installazione e la registrazione di un connettore personalizzato.

Origini contenuto per dati line-of-business

Per le origini contenuto dei dati business è necessario che le applicazioni che ospitano i dati siano specificate in un modello applicativo in un'applicazione di servizio di integrazione applicativa dei dati. È possibile creare un'origine contenuto per la ricerca per indicizzazione in tutte le applicazioni registrate nel servizio di integrazione applicativa dei dati oppure creare origini contenuto separate per la ricerca per indicizzazione in singole applicazioni. Per altre informazioni, vedere Framework di connessione di ricerca in SharePoint 2013 (questo articolo MSDN è applicabile anche a SharePoint Server).

In molti casi la pianificazione per l'integrazione dei dati business in raccolte siti non viene eseguita dalle stesse persone che si occupano del processo di pianificazione del contenuto globale. È consigliabile pertanto includere amministratori di applicazioni aziendali nei team di pianificazione del contenuto in modo che possano suggerire come integrare i dati delle applicazioni aziendali nel contenuto e presentarli in modo efficace nelle raccolte siti.

Eseguire la ricerca per indicizzazione del contenuto con pianificazioni diverse

Valutare se è opportuno definire origini contenuto con pianificazioni diverse per i motivi seguenti:

  • Necessità di bilanciare i periodi di inattività con quelli di massimo utilizzo.

  • Necessità di sottoporre più frequentemente alla ricerca per indicizzazione il contenuto aggiornato più spesso.

  • Necessità di eseguire la ricerca per indicizzazione del contenuto disponibile su server più lenti separatamente rispetto al contenuto presente in server più veloci.

  • Necessità di eseguire continuamente la ricerca per indicizzazione di un'origine contenuto di SharePoint perché sono richiesti dati sempre aggiornati. Per ulteriori informazioni, vedere Manage continuous crawls in SharePoint Server.

Motivi per cui eseguire una ricerca per indicizzazione completa

I motivi per cui l'amministratore di un'applicazione del servizio di ricerca deve effettuare una ricerca per indicizzazione completa di una o più origini contenuto includono:

  • È stata appena creata un'applicazione del servizio di ricerca e non è ancora stata effettuata la ricerca per indicizzazione dell'origine contenuto preconfigurata Siti di SharePoint locali.

  • Un'altra origine contenuto è nuova e non è ancora stata sottoposta a ricerca per indicizzazione.

  • L'amministratore dell'applicazione del servizio di ricerca ha modificato un'origine contenuto.

  • Nei server della farm è stato installato un aggiornamento software o un Service Pack. Per altre informazioni, vedere le istruzioni relative all'aggiornamento software o al Service Pack.

  • Un amministratore di un'applicazione del servizio di ricerca o un amministratore di una raccolta siti ha aggiunto o modificato una proprietà gestita. Per rendere effettiva la proprietà gestita nuova o modificata, è necessaria una ricerca per indicizzazione completa di tutte le origini contenuto interessate.

  • Si desidera rilevare le modifiche di sicurezza apportate a gruppi locali in una condivisione file dopo l'ultima ricerca per indicizzazione completa della condivisione file.

  • Si desidera risolvere i problemi relativi alle ricerche per indicizzazione incrementali consecutive. Se una ricerca per indicizzazione incrementale ha esito negativo più volte consecutivamente per un determinato contenuto, il sistema rimuoverà automaticamente il contenuto interessato dall'indice di ricerca.

  • Sono state aggiunte, eliminate o modificate le regole di ricerca per indicizzazione.

  • Si desidera sostituire un indice di ricerca danneggiato.

  • Sono cambiate le autorizzazioni dell'account utente assegnato all'account di accesso al contenuto predefinito.

Nei seguenti casi viene effettuata automaticamente una ricerca per indicizzazione completa anche se è pianificata una ricerca per indicizzazione incrementale o continua:

  • Un amministratore di ricerca ha interrotto la ricerca per indicizzazione precedente.

  • È stato ripristinato un database del contenuto oppure un amministratore di farm ha scollegato e ricollegato un database del contenuto.

  • Non è mai stata eseguita una ricerca per indicizzazione completa dell'origine contenuto da questa applicazione del servizio di ricerca.

  • Nel database di ricerca per indicizzazione non sono contenute voci per gli indirizzi sottoposti a ricerca per indicizzazione. In assenza di voci relative agli elementi sottoposti a ricerca per indicizzazione, non possono essere eseguite ricerche per indicizzazione incrementali.

Limitare o aumentare la quantità di contenuto sottoposta a ricerca per indicizzazione

Le opzioni disponibili nelle proprietà di ogni origine contenuto variano in base al tipo di origine contenuto selezionato. È possibile utilizzare le opzioni di impostazione della ricerca per indicizzazione per limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione. Per ogni origine contenuto, è possibile specificare l'estensione della ricerca per indicizzazione degli indirizzi iniziali. La maggior parte dei tipi di origini contenuto consente di specificare quanti livelli della gerarchia vengono sottoposti a ricerca per indicizzazione da ogni indirizzo iniziale. Questo comportamento viene applicato a tutti gli indirizzi iniziali di un'origine contenuto specifica. Se in alcuni siti è necessario eseguire la ricerca per indicizzazione a livello più profondo, è possibile creare ulteriori origini contenuto che includano tali siti. Nella tabella riportata di seguito sono descritte le procedure consigliate per configurare le opzioni di impostazione della ricerca per indicizzazione.

Per questo tipo di origine contenuto Se si verifica questa situazione Usare questa opzione di impostazione della ricerca per indicizzazione

Siti di SharePoint

Si desidera includere il contenuto del sito ma non quello dei siti secondari oppure si desidera eseguire la ricerca per indicizzazione del contenuto dei siti secondari in base a una pianificazione diversa.

Solo il sito di SharePoint di ogni indirizzo iniziale.

Siti di SharePoint

Si desidera includere il contenuto del sito stesso.

-oppure-

Si desidera eseguire la ricerca per indicizzazione di tutto il contenuto nell'indirizzo iniziale in base alla stessa pianificazione.

Tutto il contenuto nel nome host per ogni indirizzo iniziale.

Siti Web

Il contenuto disponibile nei siti collegati probabilmente non è pertinente.

Solo nel server di ogni indirizzo iniziale.

Siti Web

Il contenuto pertinente si trova solo nella prima pagina.

Solo la prima pagina di ogni indirizzo iniziale.

Siti Web

Si desidera limitare l'estensione della ricerca per indicizzazione ai collegamenti negli indirizzi iniziali.

Personalizzata - specificare il livello di pagine e i passaggi tra server.

Nota

In un sito ben connesso è consigliabile iniziare con un numero ridotto, in quanto specificando più di tre livelli di pagine o più di tre hop tra server può venire eseguita la ricerca per indicizzazione di tutto il contenuto in Internet.

Condivisioni file

Cartelle pubbliche di Exchange

Il contenuto disponibile nelle sottocartelle non è probabilmente pertinente.

Solo la cartella di ogni indirizzo iniziale.

Condivisioni file

Cartelle pubbliche di Exchange

Il contenuto nelle sottocartelle è probabilmente pertinente.

La cartella e tutte le sottocartelle di ogni indirizzo iniziale.

Dati business

Tutte le applicazioni registrate nell'archivio dei metadati del Catalogo dati business includono contenuto pertinente.

Archivio dei metadati del Catalogo dati business completo.

Dati business

Non tutte le applicazioni registrate nell'archivio dei metadati BDC includono contenuto pertinente.

-oppure-

Si desidera eseguire la ricerca per indicizzazione di alcune applicazioni con una pianificazione diversa.

Applicazioni selezionate.

Pianificare i connettori

Il crawler utilizza connettori (noti come "gestori di protocollo" nelle versioni precedenti di SharePoint Server) per acquisire e indicizzare il contenuto. Per i protocolli più comuni, SharePoint Server fornisce e utilizza automaticamente i connettori appropriati. Per poter eseguire la ricerca per indicizzazione di contenuto che richiede un connettore non disponibile per impostazione predefinita, è necessario prima installare un connettore di terze parti o creare un connettore personalizzato. Per un elenco dei connettori installati per impostazione predefinita, vedere Default connectors in SharePoint Server (applicabile anche a SharePoint Server).

Altre considerazioni per la pianificazione delle origini contenuto

Per gli archivi di contenuto dello stesso tipo, ad esempio siti di SharePoint, la decisione di utilizzare una o più origini contenuto dipende in larga misura da considerazioni di carattere amministrativo. Per semplificare l'amministrazione, organizzare le origini contenuto in modo che l'aggiornamento di queste ultime, delle regole di ricerca per indicizzazione e delle pianificazioni di tale ricerca sia agevole per gli amministratori.

  • Non è possibile eseguire la ricerca per indicizzazione degli stessi indirizzi iniziali utilizzando più origini contenuto nella medesima applicazione del servizio di ricerca. Se, ad esempio, si utilizza una determinata origine contenuto per eseguire la ricerca per indicizzazione di una raccolta siti e di tutti i relativi siti secondari, non sarà possibile usare un'origine contenuto diversa per eseguire la ricerca per indicizzazione di uno di tali siti secondari separatamente in base a una pianificazione diversa.

  • Gli amministratori spesso aggiornano le origini contenuto. Poiché la modifica di un'origine contenuto richiede una ricerca per indicizzazione completa dell'origine in questione, prendere in considerazione l'eventualità di creare origini contenuto distinte in modo che possano essere eseguite contemporaneamente più ricerche per indicizzazione complete se necessario e che per ognuna di tali ricerche sia necessario meno tempo.

Pianificare regole di ricerca per indicizzazione per ottimizzare le ricerche per indicizzazione

Le regole di ricerca per indicizzazione si applicano a tutte le origini contenuto nell'applicazione del servizio di ricerca. È possibile applicare tali regole a un URL specifico o a un set di URL per gli scopi seguenti:

  • Evitare di eseguire la ricerca per indicizzazione di contenuto non pertinente escludendo uno o più URL. In questo modo vengono inoltre ridotti l'utilizzo delle risorse del server e il traffico di rete.

  • Eseguire la ricerca per indicizzazione di collegamenti nell'URL senza includere l'URL stesso. Questa opzione è utile per siti con collegamenti di contenuto pertinente quando la pagina che contiene i collegamenti non include informazioni pertinenti.

  • Consentire la ricerca per indicizzazione di URL complessi. Questa opzione consente al sistema di eseguire la ricerca per indicizzazione di URL che contengono un parametro di query specificato con un punto interrogativo (?). A seconda del sito, questi URL potrebbero non includere contenuto pertinente. Poiché gli URL complessi spesso reindirizzano a siti non rilevanti, è consigliabile abilitare questa opzione solo nei siti in cui si è certi che il contenuto reso disponibile dagli URL complessi sia pertinente.

  • Abilitare la ricerca per indicizzazione del contenuto dei siti di SharePoint come pagine HTTP. Con questa opzione, il sistema di ricerca può effettuare una ricerca per indicizzazione in siti di SharePoint protetti da firewall o in scenari in cui il sito in questione limita l'accesso al servizio Web usato dal crawler (un componente di ricerca per indicizzazione nella topologia di ricerca).

  • Specificare se utilizzare l'account predefinito di accesso al contenuto, un account di accesso al contenuto diverso o un certificato client per la ricerca per indicizzazione dell'URL specificato.

Poiché la ricerca per indicizzazione del contenuto implica l'utilizzo di risorse e larghezza di banda, è consigliabile includere una quantità di contenuto minore ma di sicura pertinenza piuttosto che una quantità maggiore ma non pertinente. Dopo la distribuzione iniziale, è possibile riesaminare la query e i registri di ricerca per indicizzazione e modificare le origini contenuto e le regole di ricerca per indicizzazione per migliorarne la pertinenza e includere più contenuto.

Pianificare l'autenticazione del crawler

Quando il crawler accede agli indirizzi iniziali elencati nelle origini contenuto, è necessario che venga autenticato dai server che ospitano tale contenuto e che disponga dell'accesso a questi server. Per impostazione predefinita, nel sistema viene utilizzato l'account predefinito di accesso al contenuto. In alternativa, è possibile usare regole di indicizzazione per specificare un account di accesso al contenuto diverso da utilizzare per la ricerca per indicizzazione di contenuto specifico. Sia che si utilizzi l'account predefinito di accesso al contenuto o un account di accesso al contenuto diverso specificato da una regola di ricerca per indicizzazione, l'account utilizzato deve disporre almeno delle autorizzazioni di lettura per tutto il contenuto sottoposto a ricerca per indicizzazione. Se l'account non dispone delle autorizzazioni di lettura, il contenuto non viene sottoposto a ricerca per indicizzazione e non viene indicizzato e, di conseguenza, non è disponibile per le query.

È consigliabile specificare un account predefinito di accesso al contenuto che disponga di accesso alla maggior parte del contenuto sottoposto a ricerca per indicizzazione e utilizzare altri account di accesso al contenuto solo quando, per motivi di sicurezza, sono necessari account di accesso al contenuto distinti.

Per ogni origine contenuto pianificata, determinare gli indirizzi iniziali a cui non è possibile accedere tramite l'account predefinito di accesso al contenuto e quindi pianificare l'aggiunta di regole di ricerca per indicizzazione per tali indirizzi iniziali.

Importante

Verificare che l'account di dominio utilizzato come account predefinito di accesso al contenuto o qualsiasi altro account di accesso al contenuto non sia lo stesso account di dominio utilizzato da un pool di applicazioni associato a un'applicazione Web sottoposta a ricerca per indicizzazione. Ciò può causare la ricerca per indicizzazione e l'indicizzazione di contenuto non pubblicato dei siti di SharePoint e di versioni secondarie dei file (cronologia) nei siti di SharePoint.

Un'altra considerazione importante è che il crawler deve utilizzare lo stesso protocollo di autenticazione del server host. Per impostazione predefinita, il crawler esegue l'autenticazione mediante NTLM. È possibile configurare il crawler per l'utilizzo di un protocollo di autenticazione diverso, se necessario.

Se si utilizza l'autenticazione basata sulle attestazioni, assicurarsi che l'autenticazione di Windows sia abilitata in tutte le applicazioni Web da sottoporre a ricerca per indicizzazione.

Pianificare l'elaborazione del contenuto

Il crawler effettua la ricerca per indicizzazione nei repository di contenuto specificati dalle origini contenuto e quindi invia il contenuto e i metadati degli elementi sottoposti a ricerca per indicizzazione al componente di elaborazione del contenuto, che a sua volta legge e analizza le proprietà sottoposte a ricerca per indicizzazione e quindi le segnala al database di amministrazione della ricerca.

È possibile mappare le proprietà sottoposte a ricerca per indicizzazione alle proprietà gestite e configurare le impostazioni delle proprietà modificando lo schema di ricerca. Il componente di elaborazione del contenuto legge lo schema di ricerca e lo usa per eseguire il mapping, Nell'indice di ricerca sono incluse solo proprietà gestite, che possono essere usate per creare affinamenti della ricerca. Per altre informazioni, vedere Panoramica dello schema di ricerca in SharePoint Server.

Includere o escludere tipi di file

Nell'indice di ricerca è possibile includere contenuto di qualsiasi tipo di file. Perché possa essere indicizzato, il contenuto deve essere prima sottoposto a ricerca per indicizzazione da un apposito componente e quindi analizzato dal componente di elaborazione del contenuto. Un componente di ricerca per indicizzazione può effettuare la ricerca per indicizzazione di un file solo se la relativa estensione è inclusa nell'elenco di estensioni di nomi file nella pagina Gestisci tipi di file. Un componente di elaborazione del contenuto può analizzare il contenuto di un file sottoposto a ricerca per indicizzazione solo se si verificano le condizioni seguenti:

  • Il componente di elaborazione del contenuto ha un gestore di formato in grado di analizzare il formato del file.

  • Il componente di elaborazione del contenuto è abilitato per l'analisi dei file con il formato e l'estensione del nome specifici.

Se il componente di elaborazione del contenuto non è in grado di analizzare un file, nell'indice di ricerca verranno incluse solo le proprietà del file, ad esempio il nome.

Per impostazione predefinita, SharePoint Server soddisfa questi requisiti per molti tipi di file e può eseguire la ricerca per indicizzazione e analizzare questi tipi di file senza dover installare gestori di formato aggiuntivi. Per una panoramica dei tipi di file, vedere Default crawled file name extensions and parsed file types in SharePoint Server.

Nota

È possibile estendere la raccolta iniziale di formati di file che possono essere analizzati da SharePoint Server aggiungendo gestori di formato di terze parti basati su filtri, noti come iFilter. Un iFilter di terze parti è in grado di ignorare un gestore di formato incorporato.

Quando si pianifica di includere nell'indice di ricerca il contenuto di archivi con tipi di file non specificati nella pagina Gestisci tipi di file, prendere in considerazione quanto segue:

  • Per eseguire la ricerca per indicizzazione del tipo di file, aggiungerlo nella pagina Gestisci tipi di file.

  • Per analizzare il tipo di file:

    • Se in SharePoint Server non è disponibile un gestore per il formato specifico, installare un gestore di formato di terze parti basato su filtri per il formato di file in ogni server che ospita un componente di elaborazione del contenuto nell'applicazione del servizio di ricerca.

    • Abilitare l'analisi del formato di file e l'estensione di file in ogni server che ospita un componente di elaborazione del contenuto nell'applicazione del servizio di ricerca.

Per ulteriori informazioni, vedere Add or remove a file type from the search index in SharePoint Server.

Pianificare l'utilizzo di estrattori di entità (personalizzati)

È possibile configurare il sistema di ricerca per la ricerca di "entità" in contenuto non strutturato, ad esempio il testo del corpo o il titolo di un documento. Queste entità possono essere parole o frasi, ad esempio nomi di prodotti. Per specificare le entità da cercare, è possibile creare e distribuire dizionari personalizzati.

Le entità estratte vengono archiviate nell'indice di ricerca come proprietà gestite separate, configurate automaticamente in modo da consentire la ricerca, le query, il recupero, l'ordinamento e l'affinamento. È possibile usare tali proprietà per l'affinamento della ricerca, ad esempio per aiutare gli utenti a filtrare i risultati della ricerca.

Nel caso di aziende, è possibile usare il dizionario prepopolato per l'estrazione delle società incluso in SharePoint Server.

È inoltre possibile distribuire diversi tipi di estrattori di entità personalizzati in forma di dizionari per estrazione di entità personalizzati. Questi dizionari vengono distribuiti utilizzando Microsoft PowerShell. Per le voci di questi dizionari (parole singole o multiple) viene trovata la corrispondenza con parole o parti di parole nel contenuto facendo o meno distinzione tra maiuscole e minuscole. Per altre informazioni, vedere Creare e distribuire estrattori di entità personalizzati in SharePoint Server.

Dizionario/estrattore di entità personalizzato Descrizione

Estrazione parola

Senza distinzione tra maiuscole e minuscole, massimo cinque dizionari. La voce "sette" corrisponde ad esempio a "sette" e "Sette", ma non a "settembre".

Estrazione parte di parola

Senza distinzione tra maiuscole e minuscole, massimo cinque dizionari. La voce "sette" corrisponde ad esempio a "sette", "Sette" e a una parte di "settembre".

Estrazione parola esatta

Con distinzione tra maiuscole e minuscole, massimo un dizionario. La voce "sette" corrisponde ad esempio a "sette", ma non a "Sette" o "settembre".

Estrazione parte di parola esatta

Con distinzione tra maiuscole e minuscole, massimo un dizionario. La voce "sette" corrisponde ad esempio a "sette" e a una parte di "settembre", ma non a "Sette".

Informazioni su risultati della ricerca e federazione

In SharePoint Server si utilizza un'origine dei risultati per specificare l'URL di un provider da cui ottenere risultati di ricerca, un protocollo da utilizzare per ottenere tali risultati e altre impostazioni correlate. L'origine dei risultati predefinita preconfigurata ad esempio è Risultati di SharePoint locali.

È possibile aggiungere origini dei risultati che specificano provider di ricerca esterni, ad esempio feed o motori di ricerca remoti, da cui recuperare i risultati della ricerca. Questo scenario è indicato con il nome di federazione.

Informazioni sulla federazione

Quando si utilizza la federazione, gli utenti possono ricercare e recuperare contenuto non sottoposto a ricerca per indicizzazione dai server nella farm locale. La federazione ad esempio può fornire risultati di ricerca provenienti da un provider di ricerca sul Web, come Bing, o eventualmente da un set di dati privato a cui non si ha accesso per la ricerca per indicizzazione.

La federazione rappresenta una buona soluzione anche per un'organizzazione distribuita geograficamente in cui si desidera fornire l'accesso per la ricerca al contenuto delle diverse sedi, ognuna delle quali dotata di un proprio indice di ricerca. Poiché ogni sede fornisce risultati di ricerca dal proprio indice, non è necessario distribuire un servizio di ricerca centralizzato per la creazione di un singolo indice unificato a cui accedere. In questo contesto la federazione può offrire diversi vantaggi, tra cui quelli descritti di seguito:

  • Requisiti di larghezza di banda ridotta: un'organizzazione distribuita geograficamente potrebbe non disporre di una larghezza di banda elevata, invece necessaria per la ricerca per indicizzazione e per l'indicizzazione di quantità ingenti di contenuto remoto. Quando un'organizzazione utilizza la federazione, i dati principali che vengono trasmessi per la ricerca nella rete WAN sono costituiti solo da un set di risultati di ricerca di ogni archivio di contenuto federato.

  • Livello di aggiornamento dei risultati di ricerca: ogni divisione di un'organizzazione può eseguire la ricerca per indicizzazione del contenuto locale più rapidamente di quanto una distribuzione di ricerca centralizzata non possa per tutto il contenuto dell'intera organizzazione.

  • Variabilità della ricerca a livello di divisione: quando in un'organizzazione viene utilizzata la federazione, ogni divisione dell'organizzazione può fornire e controllare il proprio ambiente di ricerca, personalizzando la ricerca in base ai propri requisiti e alle proprie preferenze, ad esempio con un'esperienza utente e connettori di ricerca specifici. Un portale di ricerca centralizzato invece non supporta queste differenze.

  • Dimensione limitata degli indici di ricerca: un'organizzazione di grandi dimensioni distribuita geograficamente può disporre di milioni di documenti. Potrebbe non essere pratico per l'organizzazione configurare un singolo indice di ricerca unificato, a causa dell'infrastruttura necessaria per supportarlo. La federazione consente agli utenti di ogni divisione di eseguire una singola ricerca per trovare il contenuto pertinente distribuito su più indici di ricerca di dimensioni inferiori nell'organizzazione.

Utilizzo delle origini dei risultati per la federazione

Per utilizzare la federazione in SharePoint Server, selezionare uno dei seguenti protocolli nella sezione Protocollo della pagina di aggiunta o modifica di un'origine dei risultati:

Selezionare questo protocollo Per ottenere risultati di ricerca federata da questo tipo di provider

SharePoint remoto

L'indice di un servizio di ricerca in un'altra farm di SharePoint Server

OpenSearch 1.0/1.1

Un feed o motore di ricerca esterno che utilizza il protocollo OpenSearch, ad esempio Bing

Exchange

Exchange Server 2013

Nota

Se nella pagina di aggiunta o modifica di un'origine dei risultati si seleziona uno dei protocolli visualizzati nella tabella precedente, è anche necessario completare altri campi correlati nella pagina per specificare in modo completo l'origine dei risultati.

See also

Informazioni sulle origini dei risultati per la ricerca in SharePoint Server
Configurare le origini dei risultati per la ricerca in SharePoint Server
Manage crawling in SharePoint Server
Default connectors in SharePoint Server
Default crawled file name extensions and parsed file types in SharePoint Server

Framework dei connettori di ricerca in SharePoint 2013