Augmenter la précision du classifieur

Article
08/11/2023

Les classifieurs, tels que les types d’informations sensibles (SIT) et les classifieurs pouvant être formés, sont utilisés dans différents types de stratégies pour identifier les informations sensibles. Comme la plupart de ces modèles, ils identifient parfois un élément comme sensible qui ne l’est pas. Ou bien, ils peuvent ne pas identifier un élément comme étant sensible alors qu’il l’est réellement. Ils sont appelés faux positifs et faux négatifs.

Cet article explique comment vérifier si les éléments mis en correspondance par un classifieur sont des vrais positifs (une correspondance) ou des faux positifs (pas une correspondance) et comment fournir des commentaires Sur la correspondance/pas une correspondance . Vous pouvez utiliser ces commentaires pour paramétrer vos classifieurs afin d’augmenter la précision. Vous pouvez également envoyer des versions expurgées du document ainsi que les commentaires Match, Not a Match à Microsoft si vous souhaitez aider à améliorer la précision des classifieurs que Microsoft fournit.

Les expériences Match, Not a match et Contextual Summary sont disponibles dans :

Contenu Explorer : pour les sites SharePoint, les sites OneDrive
Page Éléments correspondants au type d’informations sensibles - pour les sites SharePoint, les sites OneDrive
Page Éléments mis en correspondance du classifieur entraînable - pour les sites SharePoint, les sites OneDrive
Page Alertes Protection contre la perte de données Microsoft Purview (DLP) : pour les sites SharePoint, OneDrive et les e-mails dans Exchange
Page Alertes MTP (Microsoft Threat Protection) - pour les sites SharePoint, les sites OneDrive et les e-mails dans Exchange

L’expérience résumé contextuel est disponible dans :

Protection des données Microsoft Purview (MIP) Éléments correspondants à la simulation d’étiquetage automatique - pour les sites SharePoint, les sites OneDrive

Conseil

Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez dès maintenant au hub d’essais portail de conformité Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.

S’applique à

Classifieur	Résumé contextuel	Panneau d’aperçu expurgé	Correspondance et non correspondance
S’ASSEOIR	Oui	Oui	Oui
SIT personnalisé	Oui	Non	Oui
Sit d’empreinte digitale	Non	Non	Oui
Correspondance exacte des données SIT	Non*	Non	Non
Entités nommées	Non*	Non	Non
Analyse des informations d’identification	Non	Non	Non
Classifieurs trainables intégrés	Oui**	Oui	Oui
Classifieur pouvant être entraîné personnalisé	Non	Non	Oui

* Ces classifieurs sont pris en charge dans les éléments correspondants de simulation d’étiquetage automatique MIP , pour les sites SharePoint et les sites OneDrive.

** Liste des classifieurs pouvant être entraînés intégrés et qui prennent en charge le résumé contextuel.

Importante

Les éléments de prise en charge des commentaires et des résumés contextuels correspondants dans : sites SharePoint & sites OneDrive : pour les Explorer de contenu, le type d’informations sensibles et les éléments mis en correspondance du classifieur trainable, les alertes DLP et les alertes MTP. E-mails dans Exchange : pour les alertes DLP et les alertes MTP. L’expérience de résumé contextuel prend en charge les éléments dans : sites SharePoint et sites OneDrive - pour les éléments correspondants à la simulation MIP

Licences et abonnements

Pour plus d’informations sur les licences et les abonnements appropriés, consultez les conditions de licence pour l’analyse de classification des données : Vue d’ensemble du contenu & des Explorer d’activité.

Limitations connues

Le résumé contextuel affiche uniquement un nombre limité de correspondances dans un élément donné, pas toutes les correspondances.
Le résumé contextuel et l’expérience de commentaires sont disponibles uniquement pour les éléments créés ou mis à jour après l’activation de l’expérience de commentaires pour le locataire. Les éléments classifiés avant l’activation de la fonctionnalité peuvent ne pas avoir l’expérience de résumé contextuel et de commentaires disponibles.

Comment évaluer la précision des correspondances et fournir des commentaires

L’expérience de résumé contextuel, où vous indiquez si un élément mis en correspondance est un vrai positif (Correspondance) ou un faux positif (Non une correspondance), est similaire dans tous les endroits où il est exposé.

Importante

Vous devez avoir déjà déployé des stratégies DLP qui utilisent des SIT ou des classifieurs pouvant être entraînés sur des sites OneDrive, des sites SharePoint ou des boîtes aux lettres Exchange. Vous devez également avoir eu des éléments correspondant avant qu’aucun élément n’apparaisse dans la page De résumé contextuel .

Utilisation du Explorer de contenu

Cet exemple vous montre comment utiliser l’onglet Résumé contextuel pour envoyer des commentaires.

Ouvrez la pageExplorateur de contenude classification>portail de conformité Microsoft Purview> Data.
Tapez le nom du classifieur SIT ou trainable pour lequel vous souhaitez case activée correspond dans Filtrer sur les étiquettes, les types d’informations ou les catégories.
Sélectionnez le SIT.
Sélectionnez l’emplacement et vérifiez qu’il existe une valeur différente de zéro dans la colonne Fichiers . (Les seuls emplacements pris en charge sont SharePoint et OneDrive.)
Ouvrez le dossier, puis sélectionnez un document.
Sélectionnez le lien dans la colonne Type d’informations sensibles pour le document pour voir les SITs correspondant à l’élément et le niveau de confiance.
Choisir Fermer
Ouvrez un document et sélectionnez l’onglet Résumé contextuel .
Passez en revue l’élément et vérifiez s’il s’agit ou non d’une correspondance.
S’il s’agit d’une correspondance, choisissez Fermer. Vous avez terminé.
S’il ne s’agit pas d’une correspondance, choisissez Pas de correspondance.
Si vous faites une erreur et que vous avez choisi l’option incorrecte, sélectionnez Retirer les commentaires en regard de Fermer. Cela replace l’élément dans l’état Pas de correspondance/.
Passez en revue l’élément et rédigez ou annulez la rédaction du texte.
Sélectionnez Fermer.

Utilisation de la page Éléments correspondants de type d’informations sensibles

Vous pouvez accéder aux mêmes mécanismes de commentaires dans la page Types d’informations sensibles .

Ouvrez le portail de conformité Microsoft Purview et accédez à Classification> des donnéesClassifieurs>Types d’informations sensibles.
Dans le champ Rechercher, entrez le nom du SIT dont vous souhaitez case activée la précision.
Ouvrez le SIT. L’onglet Vue d’ensemble s’affiche. Ici, vous pouvez voir le nombre d’éléments qui correspondent, le nombre d’éléments qui ne correspondent pas et le nombre d’éléments avec commentaires.
Sélectionnez l’onglet Éléments correspondants .
Ouvrez le dossier et sélectionnez un document. Seuls Les emplacements SharePoint et OneDrive sont pris en charge ici. Vérifiez qu’il existe une valeur différente de zéro dans la colonne Fichiers .
Sélectionnez le lien dans la colonne Type d’informations sensibles pour un élément pour voir les SITs correspondant à l’élément et le niveau de confiance.
Sélectionnez Fermer.
Ouvrez un document, puis sélectionnez l’onglet Résumé contextuel .
Passez en revue l’élément et vérifiez s’il s’agit d’une correspondance.
S’il s’agit d’une correspondance, choisissez Correspondance , puis Fermer.
S’il ne s’agit pas d’une correspondance, choisissez **Not a Match ****
Si vous faites une erreur et que vous sélectionnez la mauvaise option, sélectionnez Retirer les commentaires en regard de Fermer. Cela replace l’élément dans l’état Pas de correspondance/.
Sélectionnez Fermer.

Utilisation de la page Éléments mis en correspondance du classifieur trainable

Ouvrez le portail de conformité Microsoft Purview et accédez àClassifieurs classifieurs classifiables> de classification>de données.
Sélectionnez le classifieur pouvant être entraîné dont vous souhaitez case activée la précision.
Ouvrez le classifieur pouvant être formé. L’onglet Vue d’ensemble s’affiche. Ici, vous pouvez voir le nombre d’éléments qui correspondent, le nombre d’éléments qui ne correspondent pas et le nombre d’éléments avec commentaires.
Sélectionnez l’onglet Éléments correspondants .
Ouvrez le dossier et ouvrez un document. Seuls Les emplacements SharePoint et OneDrive sont pris en charge ici. Vérifiez qu’il existe une valeur différente de zéro dans la colonne Fichiers .
Ouvrez un document, puis sélectionnez l’onglet Résumé contextuel .
Passez en revue l’élément et vérifiez s’il s’agit d’une correspondance.
S’il s’agit d’une correspondance, choisissez Correspondance , puis Fermer.
S’il ne s’agit pas d’une correspondance, choisissez **Not a Match ****
Si vous faites une erreur et que vous sélectionnez la mauvaise option, choisissez Retirer les commentaires en regard de Fermer. Cela replace l’élément dans l’état Pas de correspondance/.
Sélectionnez Fermer.

Page Utilisation des alertes de protection contre la perte de données

Ouvrez le portail de conformité Microsoft Purview et accédez à la page Alertes de protection contre la> pertede données.
Choisissez une alerte.
Choisissez Afficher les détails.
Choisissez l’onglet Événements .
Agrandissez l’onglet Détails .
Passez en revue l’élément et vérifiez s’il s’agit d’une correspondance.
Choisissez Actions.
S’il s’agit d’une correspondance, fermez la fenêtre. Vous avez terminé.
S’il ne s’agit pas d’une correspondance, choisissez Actions , puis Non une correspondance.
Passez en revue l’élément et rédigez ou annulez la rédaction du texte.
Fermez la fenêtre.

Utilisation des commentaires pour paramétrer vos classifieurs

Si vos SIT ou classifieurs pouvant être entraînés retournent trop de faux positifs en fonction des commentaires, essayez certaines de ces options pour les affiner et améliorer leur précision.

Classifieurs avec capacité d’apprentissage

Le réentraînement des classifieurs personnalisés n’est plus pris en charge. Si vous avez besoin d’améliorer la précision des classifieurs pouvant être entraînés que vous avez créés, supprimez le classifieur et commencez à zéro avec des exemples de jeux plus volumineux. Pour plus d’informations, consultez Prise en main des classifieurs pouvant être entraînés.

Types d’informations sensibles

Augmentez les seuils des types d’informations sensibles trouvés pour déterminer la gravité. Il est possible d’utiliser différents seuils pour les classifieurs individuels.
Comprendre les niveaux de confiance et comment ils sont définis. Essayez d’utiliser un niveau de confiance faible avec un nombre de instance élevé ou un niveau de confiance plus élevé avec un nombre de instance faible.
Clonez et modifiez les SIT intégrés pour inclure d’autres conditions, telles que la présence de mots clés, une correspondance de valeur plus stricte ou des exigences de mise en forme plus strictes.
Modifiez un sit personnalisé pour exclure les préfixes, suffixes ou modèles connus. Par exemple, un sit personnalisé pour détecter les numéros de téléphone peut se déclencher pour chaque e-mail si vos signatures e-mail ou en-têtes de document incluent des numéros de téléphone. L’exclusion des séquences de numéros de téléphone de votre organization de votre sit personnalisé peut empêcher la règle de se déclencher pour chaque e-mail ou document.
Incluez davantage de SIT basés sur un dictionnaire comme conditions pour limiter les correspondances aux éléments qui parlent des articles pertinents. Par exemple, une règle permettant de mettre en correspondance les diagnostics des patients peut être améliorée en exigeant la présence de mots tels que diagnostic, diagnostic, état, symptôme et patient.
Pour les SIT d’entité nommée, comme Tous les noms complets, il est préférable de définir un seuil de nombre de instance plus élevé, comme 10 ou 50. Si les noms des personnes et les numéros de sécurité sociale (SSN) sont détectés ensemble, il est plus probable que les SSN soient réellement des SSN, et nous réduisons le risque que la stratégie ne se déclenche pas, car trop peu de SSN sont détectés.

Partage via