Panoramica dell'architettura di ricerca in SharePoint Server
SI APPLICA A:2013 2016 2019 Subscription Edition SharePoint in Microsoft 365
L'architettura di ricerca contiene componenti e database di ricerca. La struttura dell'architettura di ricerca dipende da dove si intende utilizzare la ricerca: per l'organizzazione o per i siti Internet. Quando si crea l'architettura di ricerca, è necessario tenere conto di fattori quali la disponibilità elevata e la tolleranza di errore, il volume del contenuto e la quantità stimata di visualizzazioni di pagina e query al secondo.
Per informazioni sulle topologie di ricerca per Use Case diversi, vedere i diagrammi tecnici Architetture di ricerca di contenuti nell'organizzazione per SharePoint Server 2016 e Architetture di ricerca di Internet Sites per SharePoint Server 2016.
Panoramica dei componenti e dei database di ricerca
Nelle tabelle seguenti è disponibile una panoramica di tutti i componenti e i database di ricerca disponibili. Per ulteriori informazioni sull'interazione tra componenti e database di ricerca, vedere il diagramma tecnico Architetture di ricerca per SharePoint Server 2016.
Componenti di ricerca
Nome componente di ricerca | Descrizione |
---|---|
Componente di ricerca per indicizzazione | Esegue ricerche per indicizzazione nelle origini del contenuto per raccogliere proprietà sottoposte a ricerca per indicizzazione e metadati provenienti da elementi sottoposti a ricerca per indicizzazione e invia tali informazioni al componente di elaborazione del contenuto. |
Componente di elaborazione del contenuto | Trasforma gli elementi sottoposti a ricerca per indicizzazione e li invia al componente di indicizzazione. Questo componente esegue inoltre il mapping delle proprietà sottoposte a ricerca per indicizzazione con le proprietà gestite. |
Componente di elaborazione dei dati analitici | Esegue l'analisi della ricerca e dell'utilizzo. |
Componente di indicizzazione | Riceve gli elementi elaborati dal componente di elaborazione del contenuto e li scrive nell'indice di ricerca. Questo componente gestisce inoltre le query in ingresso, recupera informazioni dall'indice di ricerca e invia il set di risultati nuovamente al componente di elaborazione delle query. |
Componente di elaborazione delle query | Analizza le query in ingresso. In questo modo è possibile ottimizzare la precisione, il richiamo e la rilevanza. Le query vengono inviate al componente di indice, che restituisce un set di risultati della ricerca per la query. |
Componente di amministrazione delle ricerche | Esegue i processi di sistema per le ricerche e aggiunge e inizializza nuove istanze dei componenti di ricerca. |
Database di ricerca
Nome del database di ricerca | Descrizione |
---|---|
Database di ricerca per indicizzazione | Contiene le informazioni di verifica e i dettagli cronologici sugli elementi sottoposti a ricerca per indicizzazione, ad esempio i documenti e gli URL. Archivia inoltre informazioni quali l'ora dell'ultima ricerca per indicizzazione, l'ID dell'ultima ricerca per indicizzazione e il tipo di aggiornamento (aggiunta, aggiornamento, eliminazione) effettuato durante l'ultima ricerca per indicizzazione. |
Database dei collegamenti | Contiene le informazioni non elaborate estratte dal componente di elaborazione del contenuto e le informazioni sui click di ricerca. Il componente di elaborazione dei dati analitici analizza queste informazioni. |
Database dei report analitici | Archivia i risultati dell'analisi dell'utilizzo. |
Database di amministrazione delle ricerche | Archivia i dati di configurazione della ricerca. |
Informazioni sul componente di ricerca per indicizzazione
Il componente di ricerca per indicizzazione esegue ricerche per indicizzazione nelle origini contenuto. È possibile eseguire ricerche per indicizzazione in numerose origini contenuto, ad esempio condivisioni file, contenuto di SharePoint Server, applicazioni line-of-business e altro ancora. Per recuperare le informazioni, il componente di ricerca per indicizzazione si connette alle origini contenuto richiamando il connettore di indicizzazione o il gestore di protocollo appropriato. Dopo aver recuperato il contenuto, il componente di ricerca per indicizzazione passa gli elementi sottoposti a ricerca per indicizzazione al componente di elaborazione del contenuto.
Per ulteriori informazioni sulla ricerca per indicizzazione su origini di contenuto, vedere Pianificare la ricerca per indicizzazione e la federazione in SharePoint 2013 Preview.
Informazioni sul componente di elaborazione del contenuto
Il componente di elaborazione del contenuto elabora gli elementi sottoposti a ricerca per indicizzazione e invia questi elementi al componente di indice. Il componente di elaborazione del contenuto esegue operazioni quali l'analisi dei documenti e il mapping delle proprietà. Esegue anche l'elaborazione linguistica, ad esempio il rilevamento del linguaggio e l'estrazione di entità. Il componente trasforma gli elementi sottoposti a ricerca per indicizzazione in artefatti inclusi nell'indice di ricerca. Il componente di elaborazione del contenuto scrive inoltre informazioni sui collegamenti e sugli URL nel database di collegamento.
Per ulteriori informazioni sull'elaborazione del contenuto, vedere Pianificare la ricerca per indicizzazione e la federazione in SharePoint 2013 Preview.
Informazioni sul componente di elaborazione dei dati analitici
Il componente di elaborazione dell'analisi esegue due tipi di analisi: analisi di ricerca e analisi dell'utilizzo. Questo componente usa le informazioni di queste analisi per migliorare la pertinenza della ricerca, creare report di ricerca e generare raccomandazioni e collegamenti diretti.
L'analisi della ricerca consiste nell'estrarre informazioni dal database dei collegamenti, ad esempio i collegamenti, il numero di volte che viene fatto clic su un elemento, il testo di ancoraggio, i dati correlati agli utenti e i metadati. Queste informazioni sono importanti per la pertinenza.
L'analisi dell'utilizzo consiste nell'analizzare le informazioni dei log dei dati di utilizzo ricevute dal sistema front-end tramite l'archivio eventi. Quest'analisi genera report sull'uso e sulle statistiche.
I risultati delle analisi vengono aggiunti agli elementi nell'indice di ricerca. I risultati dell'analisi dell'utilizzo inoltre vengono archiviati nel database di report di analisi.
Per ulteriori informazioni, vedere Panoramica dell'elaborazione dell'analisi in SharePoint 2013 Preview.
Informazioni sul componente di indicizzazione
È possibile dividere l'indice di ricerca in parti discrete, dette partizioni di indice. L'indice di ricerca è l'aggregazione di tutte le partizioni di indice. Ogni partizione di indice include una o più repliche dell'indice contenente le stesse informazioni. Per garantire la tolleranza di errore e la ridondanza, creare repliche dell'indice aggiuntive per ogni partizione di indice e distribuirle in più server.
Il componente di indicizzazione è la rappresentazione logica di una replica dell'indice. Nella topologia di ricerca è necessario eseguire il provisioning di un componente di indicizzazione per ogni replica dell'indice.
Il componente di indicizzazione effettua le seguenti operazioni:
Riceve gli elementi elaborati dal componente di elaborazione del contenuto e li scrive in un file di indice. I file di indice vengono archiviati su un disco nel server che ospita il componente di indicizzazione.
Riceve le query dal componente di elaborazione delle query e restituisce i set di risultati.
Per ulteriori informazioni sullo schema di ricerca e sull'indice di ricerca, vedere Panoramica dello schema di ricerca in SharePoint Server.
Informazioni sul componente di elaborazione delle query
Il componente di query analizza ed elabora query e risultati. Esegue l'elaborazione linguistica, ad esempio interruzione di parole e derivazioni. Quando il componente di elaborazione delle query riceve una query dal front-end di ricerca, analizza ed elabora la query per ottimizzare precisione, richiamo e rilevanza. La query elaborata viene inviata al componente di indice. Il componente indice restituisce un set di risultati basato sulla query elaborata al componente di elaborazione delle query, che a sua volta elabora il set di risultati prima di restituirlo al front-end di ricerca.
Per ulteriori informazioni, vedere Pianificare la trasformazione di query e l'ordinamento dei risultati in SharePoint Server.
Informazioni sul componente di amministrazione delle ricerche
Il componente di amministrazione delle ricerche esegue i processi di sistema per le ricerche. Questo componente esegue il provisioning, che consiste nell'aggiunta e nell'inizializzazione delle istanze dei componenti di ricerca.
Informazioni sul database di ricerca per indicizzazione
Nel database di ricerca per indicizzazione vengono archiviate le informazioni di verifica e i dettagli cronologici sugli elementi sottoposti a ricerca per indicizzazione. Vengono ad esempio archiviate le informazioni sull'ora dell'ultima ricerca per indicizzazione, l'ID dell'ultima ricerca per indicizzazione e il tipo di aggiornamento eseguito durante l'ultima ricerca per indicizzazione.
Informazioni sul database dei collegamenti
Nel database dei collegamenti vengono archiviate informazioni estratte dal componente di elaborazione del contenuto. Vengono inoltre archiviate informazioni sui clic di ricerca e sul numero di clic eseguiti su un risultato di ricerca nella pagina dei risultati di ricerca. Le informazioni vengono memorizzate senza essere elaborate, per essere poi analizzate dal componente di elaborazione dei dati analitici.
Informazioni sul database di report di analisi
Il database di report di analisi archivia i risultati dell'analisi di utilizzo. Inoltre, archivia le informazioni statistiche delle analisi. SharePoint Server usa queste informazioni per creare report di Excel che mostrano statistiche diverse.
Informazioni sul database di amministrazione della ricerca
Nel database di amministrazione della ricerca vengono archiviati i dati di configurazione della ricerca, ad esempio la topologia, le regole di ricerca per indicizzazione, le regole di query e i mapping tra proprietà sottoposte a ricerca per indicizzazione e proprietà gestite. Viene archiviato inoltre l'elenco di controllo di accesso (ACL) del componente di ricerca per indicizzazione. Per ogni applicazione di servizio di ricerca è consentito un solo database di amministrazione della ricerca.