Vue d’ensemble du schéma de recherche dans SharePoint Server
S’APPLIQUE À :2013 2016 2019 Édition d’abonnement SharePoint dans Microsoft 365
L'index de recherche est l'élément central de la recherche. Son contenu détermine ce que les utilisateurs trouvent lorsqu'ils saisissent des requêtes de recherche ou se servent de pages Internet ou intranet pour rechercher des informations.
Cet article explique comment le contenu est intégré dans l'index de recherche et de quelle manière il en est extrait au moyen du schéma de recherche. Le schéma de recherche comprend des propriétés analysées, des catégories de propriété analysé, le mappage entre propriétés analysées et gérées, ainsi que les paramètres de propriété gérée. Les paramètres de propriété gérée définissent le contenu à rechercher et le mode de recherche, par exemple si vous pouvez affiner une propriété ou réaliser une requête la concernant.
Analyse et propriétés analysées
Pour créer l’index de recherche, vous devez d’abord analyser le contenu. Vous pouvez analyser différentes sources de contenu, par exemple le contenu SharePoint Server, les partages de fichiers ou les profils utilisateur. Le contenu et les métadonnées des éléments que vous analysez sont représentés sous la forme de propriétés analysées.
Chaque élément qui est analysé et transmis au composant de traitement du contenu est doté de propriétés analysées qui y sont associées. Les propriétés qui déterminent l' auteur, une fonction et une date de création en sont des exemples. Toutes les propriétés analysées sont découvertes automatiquement.
Les propriétés analysées sont regroupées en catégories fondées sur le IFilter ou le gestionnaire de protocole de l'élément. Office (propriétés analysées à partir de documents Word, feuilles de calcul Excel, etc.), les données métiers (propriétés analysées à partir de bases de données, par exemple) et Web (propriétés analysées à partir de sites web) sont des exemples de catégories.
Pour plus d’informations sur l’analyse, reportez-vous à l’article Planifier l’analyse et la fédération dans SharePoint Server.
Propriétés gérées et mappage des propriétés
Pour inclure le contenu des métadonnées des propriétés analysées dans l'index de recherche, vous devez mapper les propriétés analysées sur des propriétés gérées. Seules les propriétés gérées sont écrites dans l'index de recherche.
Les propriétés gérées peuvent être dotées d'un grand nombre de paramètres. Les paramètres au sein de la propriété gérée déterminent le mode d'affichage du contenu dans les résultats de la recherche et le mode de recherche disponible pour les utilisateurs.
Vous pouvez mapper plusieurs propriétés analysées sur une seule propriété gérée. Par exemple, vous pouvez mapper les propriétés analysées « Rédacteur » et « Auteur » sur la propriété gérée « Auteur ». Ou bien, vous pouvez mapper une propriété analysée unique sur plusieurs propriétés gérées.
De plus, l'ordre dans lequel les propriétés analysées sont mappées sur une propriété gérée peut déterminer le contenu de cette dernière. Par exemple, plusieurs propriétés analysées peuvent être mappées sur une propriété gérée et celle-ci peut être définie de façon à inclure toutes les valeurs de toutes les propriétés analysées mappées sur elle. Toutefois, si vous accordez la priorité à la propriété analysée contenant le titre SharePoint par rapport à un autre titre dans le mappage, le titre SharePoint sera affiché dans les résultats de recherche.
Un ensemble de mappages par défaut entre les propriétés analysées et gérées a été défini. Reportez-vous à la rubrique relative à la vue d’ensemble des propriétés analysées et gérées dans SharePoint Server.
Certains types de propriétés analysées créent automatiquement une nouvelle propriété gérée et un mappage entre propriétés analysées et propriétés gérées. À titre d'exemple, toutes les colonnes de site des bibliothèques SharePoint sont dotées de ces fonctions de création et de mappage automatiques. Lorsque vous créez une colonne de site dans une liste et que vous analysez cette liste, une propriété analysée, une propriété gérée et un mappage entre ces deux propriétés est automatiquement créé pour la colonne de site.
Vous pouvez modifier le mappage par défaut ou tout autre mappage des propriétés analysées sur des propriétés gérées, ainsi que créer des mappages ou des propriétés gérées. Lorsque vous créez une propriété gérée ou lorsque vous modifiez certains paramètres de propriétés gérées existantes, une analyse complète doit être effectuée pour que la propriété gérée et sa valeur soient incluses dans l'index de recherche. Si la nouvelle propriété ou la propriété modifiée figure dans une bibliothèque ou une liste SharePoint, vous pouvez réindexer cette bibliothèque ou cette liste sans avoir à lancer une analyse complète de la source de contenu SharePoint. Cette action a le même effet qu'une analyse complète.
Pour plus d'informations, consultez le tableau Vue d'ensemble des paramètres des propriétés gérées plus loin dans cet article.
Schéma de recherche
Le schéma de recherche est stocké dans la base de données d'administration de la recherche. Il contient les éléments suivants :
Le mappage entre les propriétés analysées et les propriétés gérées. Il peut s'agir d'un mappage d'une propriété analysée sur une propriété gérée, d'une propriété analysée sur plusieurs propriétés gérées, de plusieurs propriétés analysées sur une propriété gérée ou même de plusieurs propriétés analysées sur plusieurs propriétés gérées.
Comment les propriétés gérées doivent être écrites dans l’index de recherche. Par exemple, dans quel index de recherche en texte intégral les valeurs des propriétés gérées doivent être écrites et dans quel groupe de pondération (contexte).
Les paramètres des différentes propriétés gérées. Par exemple, est-il possible de rechercher, interroger ou affiner des résultats de recherche en fonction de propriétés gérées spécifiques ?
Les catégories des propriétés analysées qui regroupent les propriétés en fonction de leur gestionnaire IFilter ou de protocole. Si vous modifiez une catégorie de propriétés analysées, vos modifications s'appliquent à l'intégralité des propriétés analysées de la catégorie. Cela peut avoir une influence sur les performances ainsi que sur la façon dont les éléments sont enregistrés dans l'index de recherche.
Les mises à jour du schéma de recherche sont propagées dans le système de recherche toutes les minutes.
Schémas de recherche multiples
Vous pouvez créer plusieurs schémas de recherche. Le schéma de recherche principal est défini dans l'application de service de recherche et peut être modifié sur le site Administration centrale. Les administrateurs de collection de sites et de client peuvent modifier le schéma de recherche d'une collection de sites ou d'un client en particulier. Par exemple, l'administrateur d'une collection de sites peut personnaliser le contenu de l'index de recherche en modifiant le schéma de recherche de cette même collection et, par la même, personnaliser l'expérience de recherche pour cette collection de sites. Les propriétaires de site peuvent consulter le schéma de recherche mais pas le modifier.
Notes
[!REMARQUE] Vous ne pouvez pas afficher ou modifier le schéma de recherche de la collection de sites dans Administration centrale. Pour cela, vous devez utiliser l'Administration de la collection de sites.
Index de recherche
L'index de recherche se compose d'un ensemble de fichiers dans des dossiers sur un serveur. Le composant de traitement du contenu traite les éléments analysés, se sert du schéma de recherche pour mapper des propriétés analysées sur des propriétés gérées et convertit les propriétés gérées dans un format écrit dans l'index de recherche. Outre les divers index de recherche en texte intégral, il existe des index distincts pour les propriétés gérées marquées comment étant affichables dans les résultats d'une recherche et celles marquées en tant que propriétés utilisables dans une requête. Il existe également des vecteurs d'attributs et des index numériques.
Groupes de mises à jour d’index
Quand un élément est modifié, il doit être réindexé après avoir été une nouvelle fois analysé. Pour réduire la charge de réindexation, SharePoint Server introduit plusieurs groupes de mises à jour d'index distincts.
Par défaut: contient la majorité des propriétés gérées. Ce groupe de mises à jour d'index contient toutes les propriétés gérées qui n'appartiennent pas aux groupes de mises à jour d'index Sécurité, Lien, Utilisation ou Personnes.
Sécurité: contient la propriété gérée Liste de contrôle d'accès du document.
Lien: contient les propriétés gérées liées à la structure des liens.
Utilisation: contient les propriétés gérées liées à l'utilisation des données.
Personnes: contient les propriétés gérées liées à la recherche des personnes.
Chaque groupe de mises à jour est stocké dans un dossier différent dans l’index de recherche.
Index de recherche en texte intégral
Un index de recherche en texte intégral contient tout le texte des propriétés gérées pouvant faire l'objet d'une recherche et qui sont stockées dans cet index. L'index de recherche en texte intégral est divisé en groupes de poids, également appelés « contextes ». Ces contextes se rapportent à l'importance relative de la propriété gérée (l'une des caractéristiques de classement qui entrent dans le calcul du niveau de pertinence global d'un résultat de recherche). Le numéro, ou ID, du contexte importe peu ; le modèle de classement détermine son importance relative en attribuant un coefficient de contribution à un contexte spécifique. Plus ce coefficient est élevé, plus le score l'est aussi dans le classement. Pour plus d'informations, voir la section relative à l'Influencer le classement des résultats de recherche à l'aide du schéma de recherche de l'article Vue d'ensemble du classement des résultats de recherche dans SharePoint Server.
Il existe deux index de recherche en texte intégral prédéfinis en plus de celui par défaut : l’index de recherche en texte intégral des termes SharePoint (SpTermsIdx) et l’index Personnes (PeopleIdx).
La plupart des propriétés gérées sont déjà mappées sur un contexte approprié et un index de recherche en texte intégral par défaut. Nous vous déconseillons de modifier le contexte des propriétés gérées pouvant faire l'objet d'une recherche.
Vue d’ensemble des paramètres des propriétés gérées
Les paramètres des propriétés gérées déterminent la manière dont le contenu est enregistré dans l’index de recherche. Ils permettent également de définir si les utilisateurs peuvent rechercher du contenu et le récupérer et de quelle façon.
Le schéma de recherche peut être modifié dans les composants Administration centrale, Administration de la collection de sites et Administration des clients. Les administrateurs des sites peuvent consulter le schéma de recherche, mais pas le modifier. Le tableau suivant décrit les différents paramètres et indique s'ils peuvent être modifiés à différents niveaux d'administration.
Paramètre de propriété gérée | Ce qu'il fait | Exemple | Disponible dans | Analyse complète ou réindexation de la liste/bibliothèque SharePoint nécessaire après la modification du paramètre |
---|---|---|---|---|
Utilisable dans une recherche | Permet d'interroger le contenu de la propriété gérée. Le contenu de cette propriété gérée est inclus dans l'index de recherche en texte intégral. | Si la propriété est « auteur », une simple requête pour le nom « Smith » retourne des éléments contenant le mot « Smith » et les éléments dont la propriété Auteur contient ce même mot. | Administration centrale / Administration de la collection de sites / Administration des clients | Oui |
Paramètres avancés pouvant faire l’objet d’une recherche | Permet l'affichage et la modification de l'index de recherche en texte intégral dans lequel la propriété gérée est écrite. Il permet également de changer le contexte de la propriété gérée en vue du calcul du classement selon la pertinence. Nous vous déconseillons de modifier le contexte des propriétés gérées existantes. Pour plus d'informations, voir la section relative à l'Influencer le classement des résultats de recherche à l'aide du schéma de recherche de l'article Vue d'ensemble du classement des résultats de recherche dans SharePoint Server. | Administration centrale / Administration de la collection de sites / Administration des clients | Oui | |
Utilisable dans une requête | Permet d'interroger la propriété gérée concernée. Le nom de la propriété gérée doit être inclus dans la requête, c'est-à-dire soit être précisé dans la requête même, soit être intégré par programme dans la requête. | Si la propriété gérée est « auteur », la requête doit contenir « auteur:Smith ». | Administration centrale / Administration de la collection de sites / Administration des clients | Passage du statut Désactivé au statut Activé |
Affichable dans les résultats d’une recherche | Permet de retourner le contenu de cette propriété gérée dans les résultats de la recherche. Activez ce paramètre pour les propriétés gérées pertinentes à présenter dans les résultats de la recherche. | Administration centrale / Administration de la collection de sites / Administration des clients | Passage du statut Désactivé au statut Activé | |
Autoriser plusieurs valeurs | Autorise plusieurs valeurs du même type dans cette propriété gérée. | S’il s’agit de la propriété gérée « auteur » et si un document possède plusieurs auteurs, chaque nom d’auteur est stocké comme une valeur distincte dans la propriété gérée. | Administration centrale | Oui |
Utilisable dans une recherche approfondie | Oui - actif : permet l'utilisation de la propriété comme affinement pour les résultats de la recherche dans le composant frontal. Vous devez manuellement configurer l'affinement dans le composant WebPart. Oui - latent : permet le passage ultérieur du statut utilisable dans une recherche approfondie au statut actif, sans avoir à refaire une analyse complète au moment de changer. Les deux options nécessitent une analyse complète pour être opérationnelles. IMPORTANT : si vous sélectionnez l'option « Oui - actif » ou « Oui - latent », définissez aussi la propriété gérée comme étant une propriété utilisable dans une requête. Non pris en charge dans l’expérience de recherche moderne. |
Si la propriété gérée « auteur » est définie sur Utilisable dans une recherche approfondie, vous pouvez définir Auteur comme affinement sur votre serveur de recherche frontal par la suite. | Administration centrale | Passage du statut Désactivé au statut Activé (si Triable n’est pas défini) |
Triable | Oui - actif : permet de trier le jeu de résultats en fonction de la propriété avant qu'il ne soit renvoyé. Oui - latent : permet de passer le tri en mode actif par la suite sans avoir à refaire une analyse complète au moment de changer. Les deux options nécessitent une analyse complète pour être opérationnelles. Non pris en charge dans l’expérience de recherche moderne. |
Utilisez ce paramètre pour des jeux de résultats impossibles à trier et extraire en même temps. | Administration centrale | Passage du statut Désactivé au statut Activé (si Utilisable dans une recherche approfondie n’est pas défini) |
Alias | Définit un alias pour une propriété gérée si vous préférez utiliser cet alias plutôt que le nom de la propriété gérée dans les requêtes et les résultats de la recherche. Utilisez la propriété gérée d'origine, et non l'alias, pour le mappage sur une propriété analysée. | Ayez recours à un alias si vous ne souhaitez pas créer une propriété gérée ou n'avez pas l'autorisation d'en créer une. | Administration centrale / Administration de la collection de sites / Administration des clients | Non |
Normalisation des jetons | Permet de renvoyer les résultats sans tenir compte de la casse et des signes diacritiques employés dans la requête. | La requête « curacao » renvoie également les termes « Curaçao », « curacao » et « Curacao ». | Administration centrale / Administration de la collection de sites / Administration des clients | Oui |
Correspondance complète | Par défaut, la recherche retourne des correspondances partielles entre les requêtes par rapport à une propriété managée et le contenu de la propriété gérée. Sélectionnez Compléter la correspondance pour la recherche afin de retourner des correspondances exactes à la place. |
Si une propriété managée « Title » contient « Contoso Sites », seule la requête Titre : « Contoso Sites » donne un résultat. | Administration centrale / Administration de la collection de sites / Administration des clients | Oui |
Tokenisation sans langue (SharePoint Server 2019 uniquement) | Sélectionnez la tokenisation sans langue si vous avez du contenu multilingue et que la propriété managée contient des balises basées sur des ensembles de termes de métadonnées ou d’autres identificateurs. Par défaut, la recherche dépend du langage lorsqu’elle divise les requêtes et le contenu en parties (tokenisation). Par exemple, une bibliothèque de documents contenant des feuilles de données de produit en anglais et en chinois où les identificateurs de produit ont des caractères non alphanumériques, tels que « 11.132-84-115#4 ». Lorsque la recherche traite une feuille de données, elle détecte sa langue et jetonise tout ce qu’elle contient en fonction de cette langue. Lorsque les utilisateurs recherchent un identificateur de produit, la recherche tokenise leur requête en fonction du paramètre de langue du site SharePoint sur lequel ils se mettent. Si le site est défini sur anglais et que l’utilisateur recherche un identificateur de produit qui a été tokenisé en tant que texte chinois, les jetons peuvent ne pas correspondre et les utilisateurs n’obtiennent aucun résultat. Pour améliorer les résultats pour les utilisateurs, mappez la propriété analysée pour l’identificateur de produit à une nouvelle propriété managée, « ProductID », avec la tokenisation indépendante de la langue activée. Demandez aux utilisateurs de rechercher des identificateurs de produit par rapport à la nouvelle propriété gérée, comme ceci : ProductID :"11.132-8 ». |
Si la propriété analysée d’un identificateur de produit est mappée à une propriété gérée « ProductID », la recherche utilise une tokenisation indépendante de la langue pour les requêtes sur « ProductID ». | Administration centrale / Administration de la collection de sites / Administration des clients | Oui |
Tokenisation de requête plus fine (SharePoint Server 2019 uniquement) | Utilisez ce paramètre pour aider les utilisateurs à obtenir de meilleurs résultats de recherche lorsqu’ils effectuent une recherche dans des propriétés gérées qui contiennent des métadonnées avec des caractères non alphanumériques. Ce paramètre ralentit les requêtes sur la propriété managée. Les utilisateurs qui préfèrent entrer rapidement une requête, puis parcourir les résultats pour trouver la feuille de données qu’ils recherchent, entrent généralement des requêtes comme ProductID :"132-884 ». Étant donné que la recherche par défaut divise le contenu de l’index de recherche en parties plus petites que pour les requêtes, la recherche peut ne pas trouver de correspondances pour ces requêtes. Lorsque la requête est plus précise, il est plus probable qu’il y ait des correspondances entre les jetons dans l’index de recherche et dans la requête. Les utilisateurs peuvent également rechercher la partie centrale ou la dernière partie de l’identificateur de produit. Les utilisateurs qui recherchent une feuille de données et s’attendent à obtenir uniquement des résultats correspondant à l’identificateur de produit complet écrivent généralement des requêtes comme ProductID : « 11.132-884-115#4 ». Une tokenisation plus fine des requêtes n’a pas d’impact sur ces requêtes. |
Si vous avez une propriété gérée « Identificateur de produit » qui contient « 11.132-884-115#4 », les recherches comme ProductID :"132-884 » obtiendront probablement des résultats. | Administration centrale / Administration de la collection de sites / Administration des clients | Non |
Mappages sur les propriétés analysées | La liste affiche toutes les propriétés analysées mappées sur cette propriété gérée. Une propriété gérée peut se procurer son contenu auprès d'une ou plusieurs propriétés analysées. Vous pouvez soit inclure le contenu de la totalité des propriétés analysées, soit inclure le contenu de la première propriété analysée qui n’est pas vide en suivant un ordre bien précis. |
Administration centrale / Administration de la collection de sites / Administration des clients | Oui | |
Extraction des noms d’entreprise | Permet au système d'extraire des noms de sociétés à partir de la propriété gérée lors de l'analyse d'éléments nouveaux ou mis à jour. Les entités extraites peuvent ensuite être réutilisées pour configurer des affinements. Il existe un dictionnaire déjà bien rempli pour l'extraction des noms de sociétés. Le système enregistre le contenu inchangé de la propriété gérée d'origine dans l'index et il copie également les entités extraites dans la propriété gérée « sociétés ». Celle-ci est configurée en tant que propriété pouvant faire l'objet d'une recherche, utilisable dans une requête, affichable dans les résultats d'une recherche, triable et utilisable dans une recherche approfondie. Vous pouvez modifier le dictionnaire des noms de sociétés dans le magasin de termes. Pour plus d'informations, voir Gérer l'extraction des noms de sociétés dans SharePoint Server. Non pris en charge dans l’expérience de recherche moderne. |
Administration centrale / Administration de la collection de sites / Administration des clients | Oui | |
Extraction de l’entité personnalisée | Permet d'associer un ou plusieurs extracteurs d'entités personnalisées à cette propriété gérée. Le système peut ainsi extraire des entités à partir de la propriété gérée lors de l'analyse d'éléments nouveaux ou mis à jour. Les entités extraites peuvent ensuite être réutilisées pour configurer des affinements. Pour plus d’informations, reportez-vous à l’article Créer et déployer des extracteurs d’entités personnalisées dans SharePoint Server. Non pris en charge dans l’expérience de recherche moderne. |
Administration centrale / Administration de la collection de sites | Oui |
Voir aussi
Gérer le schéma de recherche dans SharePoint Server
Vue d'ensemble des analysé et géré les propriétés de SharePoint Server