Share via


Index sémantique pour Copilot

L’index sémantique est une nouvelle fonctionnalité de recherche Microsoft 365 qui utilise Microsoft Graph pour mieux interagir avec vos données personnelles et organisationnelles. Il crée un index qui permet l’avenir des expériences de recherche et de copilote. L’index sémantique suit la sécurité et les stratégies de Microsoft Graph. Chaque fois qu’un utilisateur effectue une requête par le biais d’une recherche ou dans Microsoft Copilot, il s’agit toujours du contexte de sécurité de l’utilisateur, et seul le contenu auquel un utilisateur peut accéder s’affiche.

Vue d’ensemble

L’index sémantique se trouve au-dessus de Microsoft Graph, qui interprète les requêtes utilisateur pour produire des réponses contextuellement pertinentes qui vous aident à être plus productif. Il permet aux organisations de rechercher des milliards de vecteurs (représentations mathématiques de caractéristiques ou d’attributs) et de retourner les résultats associés. Combiné aux améliorations apportées à Microsoft Graph, l’index sémantique vous connecte aux informations pertinentes dans votre organization et repose sur l’approche complète de Microsoft en matière de sécurité, de conformité et de confidentialité et respecte toutes les limites organisationnelles au sein de votre locataire.

Qu’est-ce qu’un index ?

Le concept d’indexation des données est bien établi dans Microsoft 365 et fait partie intégrante du fonctionnement de Microsoft Graph pour accéder à l’énorme quantité de données de votre locataire Microsoft 365 aujourd’hui. Les utilisateurs voient les résultats de recherche de Microsoft Graph, qui indexe le contenu et les signaux de la plupart des applications Microsoft 365 de votre locataire pour s’assurer que les résultats de recherche sont personnalisés et élevés en fonction de vos connexions entre le contenu et les personnes de votre réseau.

Les interactions avec les données dans Microsoft Graph sont basées sur la correspondance mot clé, la personnalisation et la correspondance sociale. La recherche par mot clé interroge un index dans Microsoft Graph, qui mappe à des emplacements dans des documents ou un ensemble de documents. Microsoft 365 utilise Microsoft Graph pour classer le contenu le plus pertinent en fonction de sa connaissance des signaux supplémentaires pour les utilisateurs et leur réseau proche. C’est ce que l’on appelle la personnalisation et la mise en correspondance sociale dans Microsoft 365, ce qui détermine la pertinence des requêtes par rapport au contenu de votre organization. L’accès aux données de locataire dans Microsoft Graph est contrôlé par le contrôle d’accès en fonction du rôle. Les organisations contrôlent toujours les fonctionnalités de Recherche Microsoft via le portail Recherche et intelligence dans le Centre d'administration Microsoft 365.

Comment l’index sémantique permet de gérer vos données

L’index sémantique améliore les fonctionnalités de Microsoft 365 qui vous permettent de trouver du contenu pertinent basé sur des mots clés, des préférences personnelles et des connexions sociales. Pour ce faire, il crée des index vectorisés qui permettent une compréhension conceptuelle, ce qui permet d’identifier ce que vous recherchez et d’accéder au contenu organisationnel dont vous avez besoin. Un vecteur est une représentation numérique d’un mot, d’un pixel d’image ou d’un autre point de données. Le vecteur est organisé ou mappé avec des nombres proches placés à proximité les uns des autres pour représenter la similarité. Contrairement à un index de mot clé standard, les vecteurs sont stockés dans des espaces multidimensionnels où des points de données sémantiquement similaires sont regroupés dans l’espace vectoriel, ce qui permet à Microsoft 365 de gérer un ensemble plus large de requêtes de recherche au-delà de la « correspondance exacte ». Le graphique suivant utilise du texte (au lieu des nombres utilisés par les index vectorisés) pour montrer un exemple de similarité entre les points de données :

Graphique montrant un exemple de cluster des points de données pour l’index sémantique.

L’index sémantique permet une recherche et une récupération rapides et précises des données en fonction de leur distance de vecteur ou de leur similarité. Cela signifie qu’au lieu d’utiliser des méthodes traditionnelles pour interroger en fonction de correspondances exactes ou de critères prédéfinis, l’index sémantique peut trouver les données les plus similaires ou pertinentes en fonction de la signification sémantique ou contextuelle.

Fonctionnalités

Les fonctionnalités d’index sémantique suivantes font plus qu’améliorer les résultats de recherche : Ils travaillent ensemble pour vous aider à comprendre vos données, à trouver des informations plus rapidement et à améliorer la productivité. Les utilisateurs pourront interagir avec l’index sémantique initialement via l’intégration Microsoft Copilot pour Microsoft 365. Au fil du temps, Microsoft améliorera également l’expérience de recherche dans SharePoint Online, Microsoft Teams et l’application Microsoft 365 avec l’index sémantique. Nous déployons un index sémantique pour nos clients Microsoft 365 E3/E5 et Microsoft 365 Business Standard et Business Premium. Nous étendons également l’index sémantique aux utilisateurs Microsoft 365 A3, A5, Office 365 E3 et E5 disposant d’une licence Copilot payante. Les mises à jour d’état relatives à la disponibilité sont partagées via la feuille de route publique Centre d'administration Microsoft 365 et Microsoft 365. Voici les détails du fonctionnement de chaque fonctionnalité lorsque vous recherchez des informations.

Microsoft Copilot avec conversation ancrée sur Graph

L’index sémantique permet de faire apparaître les résultats dans Microsoft Copilot avec une conversation ancrée sur Graph en comprenant l’intention de votre requête et en ajoutant des informations supplémentaires à votre invite Microsoft Copilot. Les informations pertinentes sont obtenues dans Microsoft Graph et l’index sémantique pour fournir au LLM plus d’informations à raisonner. Par exemple, supposons que vous souhaitiez que Microsoft Copilot localise un e-mail où un collègue a fait l’éloge du travail de conception d’un fournisseur. L’index sémantique inclut des mots proches (par exemple, énervés, excités, émerveillés) dans la recherche pour élargir la zone de recherche et donner le meilleur résultat. Tout ce travail se déroule en arrière-plan pour ajouter de la pertinence aux résultats que vous recherchez avec Microsoft Copilot, sans complexité supplémentaire.

La recherche sémantique capture la signification sémantique de votre requête, de sorte que le texte sémantiquement similaire a des valeurs numériques similaires pour mieux comprendre la langue. En utilisant des vecteurs, la recherche sémantique peut comprendre les relations entre différentes formes de mots (par exemple, technologie, technologie, technologies ; États-Unis, États-Unis, États-Unis, États-Unis d’Amérique ; chien, chat, animal de compagnie) et naturellement capturer des synonymes pour augmenter la quantité d’informations qui peuvent être recherchées. Ces améliorations aident la recherche sémantique à comprendre l’intention des phrases, des extraits de code, des documents et des réunions. Il identifie également les ressources associées à votre requête ou à votre exemple de contenu, et prépare les utilisateurs à interagir avec Microsoft Copilot pour Microsoft 365.

Fonctionnement de l’index sémantique

L’index sémantique améliore Microsoft Copilot et les résultats de recherche dans l’application Microsoft 365, SharePoint Online et Microsoft Teams. Pour ce faire, il crée deux index pour prendre en charge une expérience de recherche améliorée et une compréhension conceptuelle de vos données en ligne activées automatiquement par Microsoft.

L’indexation au niveau de l’utilisateur crée un index personnalisé pour vos yeux uniquement sur un ensemble de données de travail et le rend plus accessible pour vous permettre d’effectuer des tâches quotidiennes. Cela inclut tout contenu textuel que vous créez ou avec lequel vous interagissez, comme les e-mails, les documents qui vous mention, que vous commentez ou partagez. L’index au niveau du locataire ajoute des fichiers SharePoint Online textuels accessibles à au moins deux personnes dans votre organization via l’héritage de site. Toutefois, il ne présente les résultats à un utilisateur que si celui-ci a déjà accès au contenu contrôlé par le contrôle d’accès en fonction du rôle. En outre, le site SharePoint Online doit continuer à faire l’objet d’une recherche.

La section suivante explique comment activer chaque index, comment le flux de données dans Copilot pour Microsoft 365 utilise l’index sémantique, quels types de fichiers chaque index peut gérer et comment chaque index traite les mises à jour.

Activation

Nous en sommes aux premières étapes du déploiement de l’index sémantique pour toutes les organisations disposant de Copilot pour Microsoft 365 et d’une licence Microsoft 365 éligible, sans aucune intervention administrative.

Nous avons reçu des commentaires de clients indiquant que l’activation de l’index sémantique status indicateur précédemment dans le centre Administration Microsoft 365 était déroutante. Pour réduire la confusion des clients, nous avons temporairement supprimé l’indicateur jusqu’à ce que nous puissions déterminer une meilleure approche. Aucun changement n’est apporté à notre engagement à fournir aux clients une expérience de recherche exceptionnelle, et Microsoft continuera à indexer automatiquement les organisations.

Flux de données

L’index sémantique interagit avec Microsoft Graph pour fournir aux utilisateurs un accès aux informations dans l’index au niveau de l’utilisateur et au niveau du locataire. Le diagramme ci-dessous montre comment fonctionne le flux de données pour une requête à l’aide de Copilot pour Microsoft 365.

Graphique montrant la relation entre Copilot pour Microsoft 365, Microsoft 365 Apps, Microsoft Graph et modèle de langage volumineux.

Les invites utilisateur des applications Microsoft 365 sont envoyées à Copilot (1), et Copilot accède à Microsoft Graph et à l’index sémantique pour traitement (2). Copilot envoie l’invite modifiée au modèle de langage large (3), reçoit la réponse LLM (4), puis accède à Microsoft Graph et à l’index sémantique pour le post-traitement (5). Copilot renvoie ensuite la réponse et la commande d’application aux applications Microsoft 365. Toutes les demandes sont chiffrées par HTTPS et les données client restent chiffrées au repos.

Types de contenu pris en charge

L’index sémantique prend en charge l’indexation des types de boîtes aux lettres utilisateur et de fichiers répertoriés dans le tableau suivant, avec d’autres types de fichiers pris en charge au fil du temps. Une liste des types de fichiers pris en charge pour l’index de niveau utilisateur et l’index au niveau du locataire est incluse dans la table.

Type de contenu/fichier Niveau utilisateur Niveau du locataire
Boîte aux lettres utilisateur Pris en charge Non applicable
Boîte aux lettres déléguée Non pris en charge Non applicable
Boîte aux lettres partagée Non pris en charge Non applicable
Données de boîte aux lettres archivées Non pris en charge Non applicable
Données SharePoint archivées Non pris en charge Non pris en charge
documents Word (doc/docx) Pris en charge Pris en charge
PowerPoint (pptx) Pris en charge Pris en charge
Fichiers .pdf Pris en charge Pris en charge
Pages web (aspx) Pris en charge Pris en charge
Fichiers OneNote (un) Pris en charge Pris en charge
Données du connecteur Graph Non applicable Pris en charge

Mises à jour d’index

Lorsque l’index sémantique a terminé l’indexation pour un client pour la première fois, les documents créés par les utilisateurs sont indexés en quasi-temps réel dans la boîte aux lettres de l’utilisateur. Les nouveaux documents ajoutés aux sites SharePoint Online accessibles, via l’héritage de site, par au moins deux utilisateurs sont indexés quotidiennement. Lorsqu’un document de niveau utilisateur et locataire indexé est mis à jour, les modifications sont immédiatement indexées.

Administration

Nous fournissons aux administrateurs des activités facultatives pour préparer et gérer l’index sémantique via le Centre d'administration Microsoft 365. Aucune intervention administrative n’est requise pour activer l’index sémantique, car le service est automatiquement activé par Microsoft. L’index sémantique est une amélioration de La recherche Microsoft 365 et ne peut pas être désactivé.

Les administrateurs peuvent choisir de préparer et de gérer l’index sémantique en examinant les considérations relatives à la planification et au déploiement d’une collaboration de fichiers dans SharePoint et au partage des autorisations dans l’expérience moderne SharePoint. Les administrateurs peuvent choisir d’exclure des fichiers de l’index sémantique en examinant les considérations relatives à l’exclusion de données avec Protection contre la perte de données Microsoft Purview (DLP). Si aucune solution DLP n’est présente, les administrateurs peuvent exclure les sites SharePoint Online de l’index au niveau du locataire.

Exclusion des sites SharePoint Online

Parfois, les organisations sans Protection contre la perte de données Microsoft Purview peuvent souhaiter exclure un site SharePoint Online de l’indexation de ses données par Recherche Microsoft. Ces étapes ne doivent être prises en compte que pour les données sensibles, telles que la paie, les ressources humaines ou les informations financières. Pour exclure un site SharePoint Online, procédez comme suit :

  1. Accédez au site avec les autorisations d’administrateur appropriées.
  2. Sélectionnez Paramètres , puis Informations sur le site dans le menu déroulant.
  3. Sélectionnez Afficher tous les paramètres du site pour afficher la page Paramètres du site.
  4. Sélectionnez Recherche et disponibilité hors connexion sous la catégorie Recherche , puis sélectionnez Non pour Autoriser ce site à apparaître dans les résultats de la recherche afin de l’exclure à la fois de Recherche Microsoft et de la recherche d’index sémantique. Cette opération peut également être effectuée avec PowerShell pour plusieurs sites.

Capture d’écran montrant les paramètres d’exclusion des sites SharePoint Online.

Recherche Microsoft et l’index sémantique prennent en charge l’exclusion du contenu SharePoint Online de l’index au niveau du locataire uniquement. Il n’existe aucune option permettant d’exclure les résultats de Recherche Microsoft uniquement ou de l’index sémantique uniquement ; les actions s’appliquent aux deux en même temps.

Configuration des insights d’élément

Dans la page Recherche et intelligence de la Centre d'administration Microsoft 365, les informations sur les éléments sont activées par défaut. La désactivation des informations sur les personnes ou les éléments réduit l’expérience de recherche Microsoft et d’index sémantique, car les résultats n’incluent pas les personnes pertinentes qui auraient été dérivées de groupes de distribution ou de l’organigramme.

  • Personnes insights fournissent une liste de personnes pertinentes à un utilisateur en fonction de leur travail collaboratif public dans Microsoft 365. La collaboration publique comprend les membres d’un groupe de distribution public et les individus connectés dans l’organigramme.

  • Les informations sur les éléments permettent d’obtenir des recommandations pour les personnes de votre organization en fonction de leur travail collaboratif dans Microsoft 365. Ces recommandations peuvent inclure, sans s’y limiter, des documents ou d’autres types de contenu et apparaître dans les cartes de personnes (contacts), Delve, l’application Microsoft 365, les résultats Microsoft Copilot et d’autres emplacements.

Les insights d’élément et les insights Personnes ne couvrent pas les fonctionnalités de personnalisation basées sur les données d’un utilisateur.

Incorporation d’informations tierces

L’index sémantique permet aux organisations de placer vos données ou contenus organisationnels en dehors de Microsoft 365 dans Copilot pour Microsoft 365 et l’écosystème Microsoft 365. Les connecteurs Graph permettent l’ingestion de sources de données externes, ce qui permet d’enrichir l’expérience Copilot des utilisateurs avec des résultats pertinents qui tirent parti des données Microsoft 365 et des données tierces. Microsoft indexe toutes vos données de connecteurs Graph tout en conservant des contrôles d’accès pour le contenu. Cela étend les types de sources de contenu qui peuvent faire l’objet d’une recherche dans vos applications de productivité Microsoft 365 et l’écosystème Microsoft plus large, et fonctionne mieux lorsque le contenu du connecteur est riche en texte. Les données tierces peuvent être hébergées localement ou dans des clouds publics ou privés, et ces informations sont consommées par Microsoft Graph, qui peut être ingérée dans l’index sémantique pour vous aider à fournir à votre organization tout le contexte dans Microsoft 365 et le contenu tiers de votre organization. Pour en savoir plus sur les exigences de licence des connecteurs graphiques pour les Microsoft 365 Entreprise et les Copilot pour Microsoft 365, consultez Conditions requises et tarification des licences.

En outre, plus de 30 plug-ins et connecteurs Graph, y compris la recherche web optimisée par Bing, Microsoft Dataverse, Jira, Trello, Mural, Confluence, Freshworks et Priority Matrix sont désormais disponibles. Des milliers de plug-ins métier et tiers supplémentaires seront activés dans les mois à venir, car nous intégrons des extensions de message Teams existantes et des connecteurs Microsoft Power Platform à Copilot pour Microsoft 365. Cet écosystème étendu de plug-ins pour les Copilot pour Microsoft 365 exposés dans les outils utilisés chaque jour pour le travail apportera une valeur sans précédent à nos clients mutuels à mesure que nous transformons la façon dont le travail est effectué ensemble.

Confidentialité, conformité et sécurité

Le modèle d’autorisations relatif à votre locataire Microsoft 365 peut vous aider à garantir que les données ne fuient pas involontairement entre les utilisateurs, les groupes et les locataires. L’index sémantique présente uniquement les données auxquelles chaque individu peut accéder à l’aide des mêmes contrôles sous-jacents pour l’accès aux données que dans d’autres services Microsoft 365. L’index sémantique respecte la limite d’accès basée sur l’identité de l’utilisateur afin que le processus de mise à l’terre accède uniquement au contenu auquel l’utilisateur actuel est autorisé à accéder. Pour plus d’informations, consultez la politique de confidentialité de Microsoft et la documentation du service.

Microsoft Copilot pour Microsoft 365 est conforme à nos engagements existants en matière de confidentialité, de sécurité et de conformité envers les clients commerciaux Microsoft 365, y compris le Règlement général sur la protection des données (RGPD) et la limite de données de l’Union européenne (UE). Les invites, les réponses et les données accessibles par le biais de l’index sémantique ne sont pas utilisés pour entraîner les llms de base, y compris celles utilisées par Copilot pour Microsoft 365. Pour plus d’informations, consultez Données, confidentialité et sécurité pour Copilot pour Microsoft 365.

Stockage et traitement

Les données générées par l’index sémantique restent dans le locataire de votre entreprise et sont conformes à vos stratégies et processus de sécurité, de conformité, d’identité et de confidentialité. L’index sémantique fonctionne uniquement avec le contenu pour lequel vos utilisateurs disposent déjà d’autorisations et n’affecte pas les quotas de stockage.

Les informations d’index au niveau de l’utilisateur sont stockées à l’emplacement où se trouve la boîte aux lettres de l’utilisateur, et les informations d’index au niveau du client sont stockées dans un conteneur client isolé et protégé situé dans la région où se trouve le site SharePoint (région d’accueil ou autrement spécifiée par l’administrateur du locataire). Pour les clients au sein de la limite de données de l’Union européenne (EUDB), l’index est stocké dans un centre de données basé dans l’UE/AELE. Le traitement d’autres clients peut avoir lieu dans une région de locataire ou dans le États-Unis. Pour les organisations multigéographiques, toutes les limites géographiques sont respectées. Les données dans la région sont stockées et traitées dans chaque région. Au moment de la requête, une requête fédérée est envoyée à toutes les régions et fusionne l’index sémantique et mot clé résultats de la recherche en une seule réponse à l’utilisateur.

Prise en charge de la clé client Microsoft Purview (BYOK)

L’index sémantique fournit une prise en charge BYOK pour les entreprises qui ont activé BYOK dans leur environnement pour l’index de niveau utilisateur et l’index au niveau du locataire. Microsoft active automatiquement l’index sémantique pour les clients compatibles BYOK sans aucune intervention administrative.

Protection des informations

Dans le contexte de la recherche, il n’existe aucune autre façon d’exclure des données de l’index sémantique à l’aide des fonctionnalités de protection des informations. L’index sémantique hérite des paramètres de sécurité et de confidentialité de Recherche Microsoft, et les données introduites à partir de connecteurs tiers reçoivent le même stockage et les mêmes protections que les autres données Microsoft 365. Pour les organisations qui examinent d’autres options de protection des informations, Microsoft 365 fournit des fonctionnalités intégrées dans les applications microsoft 365 et les produits complémentaires pour aider les administrateurs à protéger les données organisationnelles par le biais de la réduction des données et de la réduction du surpartage. Les sections suivantes décrivent les options disponibles pour les organisations à titre de référence uniquement.

Réduction des données

La réduction des données réduit la quantité de données accessibles dans votre organization. La conservation et la suppression de contenu sont souvent nécessaires pour la conformité et les exigences réglementaires, mais la suppression de contenu qui n’a plus de valeur métier vous aide également à gérer les risques et la responsabilité. Gestion du cycle de vie des données Microsoft Purview, qui est concédé sous licence séparément, peut être utilisé pour supprimer du contenu qui n’est plus nécessaire avec des stratégies de rétention pour la gestion à grande échelle, et des étiquettes de rétention pour les exceptions et le contrôle granulaire.

Réduire le surpartage

Les organisations ont depuis longtemps été en mesure de prendre des mesures pour réduire le surpartage dans Microsoft 365 à l’aide des contrôles existants dans le Centre d'administration Microsoft 365 et SharePoint Online. Il est important de noter que l’index sémantique ne modifie pas les autorisations d’accès au contenu et ne change pas les principes de la façon dont les utilisateurs doivent partager des informations avec leurs collègues. Par exemple, l’index sémantique ne rend pas le contenu partagé avec un lien qui fonctionne avec tous les membres de mon organization partie de l’index au niveau du locataire. Seuls les utilisateurs qui sélectionnent un lien auquel ils ont accès auront les informations ajoutées à leur index utilisateur. Il est recommandé que les organisations prennent en compte les éléments suivants lors de l’exploration des options de protection des informations :

  • Planifier la collaboration de fichiers sécurisés : passez en revue Planifier et déployer une collaboration de fichiers pour en savoir plus sur les pratiques recommandées pour utiliser un environnement de collaboration de fichiers sécurisé et productif pour vos utilisateurs.

  • Taille appropriée de l’accès utilisateur aux données pour réduire la liste : réduisez le surpartage en héritant des listes d’exclusion pour les sites SharePoint Online et en effectuant des vérifications de contrôle d’accès en temps réel présentes dans l’index sémantique. Les organisations peuvent envisager d’utiliser le module complémentaire Gestion avancée SharePoint Syntex pour gérer et régir ces autorisations.

  • Utiliser des étiquettes de confidentialité : une autre méthode consiste à étiqueter les données avec Protection des données Microsoft Purview étiquettes de confidentialité. Les étiquettes qui appliquent le chiffrement utilisent des droits d’utilisation pour fournir une couche de protection supplémentaire, qui sont également incluses dans le découpage de recherche (c’est-à-dire, pris en charge pour le filtrage et les règles côté application utilisées pour le marquage visuel et les restrictions d’accès).

  • Limiter l’accès : Protection contre la perte de données Microsoft Purview est disponible dans Microsoft 365 E5 et peut être utilisé pour limiter rétroactivement et temporairement l’accès aux documents signalés comme étant surpartagés. Si vous n’êtes pas un client Microsoft 365 E5, les organisations peuvent utiliser la version d’évaluation de 90 jours des solutions Microsoft Purview pour explorer comment les fonctionnalités supplémentaires de Purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données.

Pour les clients désireux d’explorer comment déployer des solutions avancées de protection des informations, consultez l’article suivant qui explique comment déployer une solution de protection des informations avec Microsoft Purview. Pour plus d’informations sur la façon dont Microsoft Purview peut vous aider à renforcer vos exigences en matière de sécurité et de conformité des données pour Copilot pour Microsoft 365, consultez Protéger et gérer les interactions Copilot pour Microsoft 365 avec Microsoft Purview.

Ressources supplémentaires

Microsoft 365, Microsoft Graph et l’index sémantique permettent une expressivité sans précédent pour la recherche, la conversation et les copilotes en tirant parti des données Microsoft 365. Cette expressivité permet de mettre en évidence les données de base appropriées pour tirer le meilleur parti de vos données organisationnelles avec Microsoft 365 et Copilot pour Microsoft 365.

Pour en savoir plus sur Copilot pour Microsoft 365, case activée ces ressources :