Partage via


Tester un type d’informations sensibles correspondant exactement aux données

Conseil

Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment les fonctionnalités supplémentaires de Purview peuvent aider votre organisation à gérer les besoins en matière de sécurité et de conformité des données. Commencez maintenant sur le hub d’essais du portail de conformité Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.

S’applique à

Une fois que votre type d’informations sensibles (SIT) de correspondance exacte des données (EDM) a été créé, et une heure après avoir vérifié que votre table d’informations sensibles a terminé le chargement et l’indexation, vous pouvez tester si elle détecte ou non les informations que vous souhaitez protéger à l’aide de la fonction Test dans la section Types d’informations sensibles du portail de conformité Microsoft Purview.

Remarque

La propagation des modifications dans un sit EDM existant peut prendre un certain temps. Si vous apportez des modifications à un sit EDM afin de résoudre les problèmes de détection, veillez à attendre au moins une heure après avoir apporté ces modifications avant d’utiliser la fonction Test pour valider leur impact.

Quelle que soit la méthode que vous utilisez pour le test, les résultats du test incluent des correspondances pour le sit EDM spécifique et pour les éléments principaux configurés pour ce sit EDM.

Méthodes de test de votre EDM SIT

Il existe deux méthodes que vous pouvez utiliser pour tester votre sit EDM.

Méthode Disponible dans nouvelle expérience EDM Disponible dans l’expérience EDM nouvelle et classique
Méthode SIT (Sensitive Information Type) Oui Oui
Méthode des classifieurs EDM Oui Non

Remarque

Si vous utilisez l’expérience EDM classique, vous devez utiliser la méthode SIT.

Test d’un sit EDM avec la méthode Types d’informations sensibles

Pour tester un sit EDM avec la méthode Types d’informations sensibles , procédez comme suit.

Sélectionnez l’onglet approprié pour le portail que vous utilisez. Pour en savoir plus sur le portail Microsoft Purview, consultez Portail Microsoft Purview. Pour en savoir plus sur le portail de conformité, consultez Portail de conformité Microsoft Purview.

  1. Connectez-vous au portail >Microsoft PurviewInformation Protection>Classifieurs>Types d’informations sensibles.

  2. Sélectionnez votre sit EDM dans la liste, puis sélectionnez l’icône Test .

  3. Dans le volet volant, chargez un fichier qui contient les données que vous souhaitez détecter. Par exemple, créez un fichier qui contient un sous-ensemble des lignes de votre table d’informations sensibles. Si vous avez utilisé la fonctionnalité de correspondance configurable dans votre schéma pour définir des délimiteurs ignorés, vérifiez que l’exemple de fichier inclut des exemples avec et sans ces délimiteurs.

  4. Choisissez Test.

  5. Une fois le fichier chargé et analysé, recherchez les correspondances avec votre sit EDM.

  6. Si la fonction Test dans le SIT détecte une correspondance, vérifiez que le SIT ne la supprime pas ou n’extrait pas l’élément correspondant de manière incorrecte. Les problèmes courants incluent les SIT qui :

    • Extraire uniquement une sous-chaîne de la chaîne complète qui doit être détectée
    • Récupérer uniquement le premier mot d’une chaîne à plusieurs mots
    • Inclure des symboles ou des caractères supplémentaires dans l’extraction

Pour plus d’informations sur l’utilisation des expressions régulières, consultez Le langage d’expression régulière - Référence rapide.

Tester votre EDM SIT avec la méthode EDM Classifier

Sélectionnez l’onglet approprié pour le portail que vous utilisez. Pour en savoir plus sur le portail Microsoft Purview, consultez Portail Microsoft Purview. Pour en savoir plus sur le portail de conformité, consultez Portail de conformité Microsoft Purview.

  1. Connectez-vous auxclassifieurs>EDM du portail> Microsoft PurviewInformation Protection>.

  2. Vérifiez que le bouton bascule Nouvelle expérience EDM est défini sur Activé.

  3. Sélectionnez votre sit EDM dans la liste, puis sélectionnez l’icône Test .

  4. Chargez un fichier qui contient les données que vous souhaitez détecter. Par exemple, créez un fichier qui contient un sous-ensemble des lignes de votre table d’informations sensibles. Si vous avez utilisé la fonctionnalité de correspondance configurable dans votre schéma pour définir des délimiteurs ignorés, assurez-vous que votre exemple de fichier inclut des exemples avec et sans ces délimiteurs.

  5. Une fois le fichier chargé et analysé, recherchez les correspondances avec votre sit EDM.

  6. Si la fonction Test dans le SIT détecte une correspondance, vérifiez que le SIT ne la supprime pas ou n’extrait pas l’élément correspondant de manière incorrecte. Les problèmes courants incluent les SIT qui :

    • Extraire uniquement une sous-chaîne de la chaîne complète qui doit être détectée
    • Récupérer uniquement le premier mot d’une chaîne à plusieurs mots
    • Inclure des symboles ou des caractères supplémentaires dans l’extraction

Tester votre sit EDM à l’aide de PowerShell

Pour tester l’utilisation de PowerShell, utilisez l’applet de commande PowerShell suivante :

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Quelle que soit la méthode que vous utilisez pour le test, les résultats du test incluent des correspondances pour le sit EDM spécifique et pour les éléments principaux configurés pour ce sit EDM.

Remarque

Lorsque vous créez ou modifiez un type d’informations sensibles EDM ou le sit principal sur lequel un type EDM est basé, tout nouveau contenu (ainsi que le contenu qui est modifié après avoir apporté des modifications aux SIT) est analysé pour le contenu qui correspond aux nouvelles définitions. Toutefois, le contenu préexistant n’est pas analysé tant qu’il n’est pas modifié ou réindexé.

Pour forcer la réinsuration du contenu existant dans un site ou une bibliothèque SharePoint, ou dans OneDrive, suivez les instructions fournies dans Demander manuellement l’analyse et la réindexation d’un site, d’une bibliothèque ou d’une liste.

Tester votre sit EDM avec des stratégies de protection des informations

Vous pouvez voir où votre sit EDM est utilisé et sa précision en production, en l’utilisant dans les stratégies :

  1. Créez une stratégie d’étiquetage automatique et exécutez-la dans Vue d’ensemble de la simulation.

  2. Ajoutez du contenu qui déclenchera le sit EDM, ainsi que du contenu qui ne déclenchera pas le sit EDM, à un emplacement que votre stratégie surveille.

  3. Ouvrez l’onglet Éléments à réviser pour vérifier les correspondances.

  4. Ajustez vos stratégies en fonction des besoins.

Une fois que vous êtes satisfait des résultats de vos tests et de votre paramétrage, votre sit personnalisé basé sur EDM est prêt à être utilisé dans les stratégies de protection des informations, par exemple :

Conseils de dépannage

Si votre sit EDM ne détecte aucune correspondance dans vos données, les conseils suivants peuvent vous aider à diagnostiquer le problème.

Problème Conseil de dépannage
Aucune correspondance trouvée Vérifiez que vos données sensibles ont été chargées correctement à l’aide des commandes expliquées dans Hachage et chargez la table de source d’informations sensibles pour connaître les types d’informations sensibles correspondant exactement aux données.
Aucune correspondance trouvée Testez le SIT que vous avez utilisé lorsque vous avez configuré l’élément principal dans chacun de vos modèles. Ce test vérifie si le SIT peut correspondre aux exemples de l’élément. L’utilisation d’un sit mal défini comme élément de classification d’un sit EDM est la cause la plus courante des échecs de détection dans EDM.
Le SIT que vous avez sélectionné pour un élément principal dans le type EDM ne trouve pas de correspondance dans l’élément ou trouve moins de correspondances que prévu Vérifiez que le sit prend en charge les séparateurs et les délimiteurs qui se produisent dans le contenu. Veillez à inclure les délimiteurs ignorés définis dans votre schéma.
Le SIT associé à votre élément principal trouve des correspondances dans votre contenu, mais pas le SIT EDM.
  • Vérifiez si vos instructions REGEX interceptent les délimiteurs d’espaces blancs au début ou à la fin d’un élément que vous souhaitez détecter. Par exemple, recherchez les instructions qui incluent le \s délimiteur. Si des délimiteurs d’espaces blancs sont inclus, l’espace blanc ne correspond pas à la valeur hachée dans la table de données. Au lieu de cela, utilisez un délimiteur de mot, tel que \b.
  • Vérifiez vos instructions REGEX pour vous assurer qu’elles capturent la chaîne entière que vous souhaitez détecter, et pas seulement une sous-chaîne. Par exemple, considérez ce modèle pour les adresses e-mail : \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Ce modèle correspondra correctement à user@contoso.com, mais ne sera capturé user@contoso.co.jp que sous une forme incomplète.
Un sit EDM avec des éléments principaux, mais aucun élément secondaire défini, détecte les éléments, mais ne détecte pas les correspondances (ou détecte moins de correspondances que prévu) lorsque les éléments principaux et secondaires sont requis. Si les valeurs d’une colonne utilisée pour la preuve secondaire ne sont pas composées d’un seul mot ou de chaînes qui ne contiennent pas d’espaces, de virgules ou d’autres séparateurs de mots, il existe deux façons de tester :
  1. Sélectionnez l’option de correspondance à plusieurs jetons .
  2. Associez les valeurs à un sit qui utilise un REGEX conçu pour détecter les chaînes à plusieurs mots qui suivent le modèle souhaité (par exemple, un nombre fixe de mots consécutifs commençant par un caractère majuscule) ou un dictionnaire de mots clés qui répertorie toutes les valeurs uniques de cette colonne. Par exemple, s’il existe une colonne de preuve supplémentaire pour la ville ou la résidence d’une personne, vous pouvez créer une liste avec tous les noms de ville uniques de la table, puis l’utiliser pour créer un type d’informations sensibles basé sur un dictionnaire.

Utilisez ce sit comme élément de classification pour la colonne correspondante dans votre sit EDM en exportant et en modifiant la définition SIT EDM au format XML. Pour plus d’informations, consultez Créer un package de règles manuellement.
La fonction de test SIT ne détecte aucune correspondance. Vérifiez que le sit que vous avez sélectionné inclut des exigences pour des mots clés supplémentaires ou d’autres validations. Pour les SIT intégrés, consultez Définitions d’entité de type informations sensibles pour déterminer la configuration minimale requise pour la correspondance de chaque type.
La fonctionnalité Test fonctionne, mais vos éléments SharePoint ou OneDrive ne sont pas détectés dans les règles DLP ou d’étiquetage automatique Vérifiez que les documents dans lesquels vous prévoyez de trouver des correspondances s’affichent réellement dans l’Explorateur de contenu. Les correspondances sont détectées uniquement dans le contenu créé après l’application des modifications apportées au SIT. Par conséquent, si les correspondances attendues n’apparaissent pas, analysez à nouveau les sites et les bibliothèques pour les éléments préexistants. Pour plus d’informations sur l’analyse à nouveau de SharePoint et OneDrive, voir Demander manuellement l’analyse et la réindexation d’un site, d’une bibliothèque ou d’une liste.
Les règles DLP ou d’étiquetage automatique qui nécessitent plusieurs correspondances ne se déclenchent pas Assurez-vous que les exigences de proximité pour votre SIT EDM et les SIT de base sont remplies. Par exemple, si la distance maximale entre l’élément principal et les mots clés de prise en charge est de 300 caractères, mais que les mots clés sont uniquement présents dans la première ligne d’une table longue, seules les premières lignes de valeurs correspondantes sont susceptibles de répondre aux exigences de proximité. Modifiez vos définitions SIT pour prendre en charge des règles de proximité plus souples ou utilisez l’option N’importe où dans le document pour les conditions de preuve supplémentaires.
La détection d’un sit EDM est incohérente ou erratique Assurez-vous que le sit que vous avez utilisé comme base pour l’élément principal dans votre sit EDM ne détecte pas le contenu inutile. L’utilisation d’un sit qui correspond à un trop grand nombre de contenus non liés, tels que n’importe quel mot, n’importe quel nombre ou toutes les adresses e-mail, peut amener le service à ignorer les correspondances pertinentes. Vérifiez le nombre d’éléments de contenu qui correspondent au type sensible que vous avez utilisé pour vos éléments principaux dans l’Explorateur de contenu.

Pour estimer si le SIT correspond à trop de contenu :
  1. Divisez le nombre d’éléments de contenu dans l’Explorateur de contenu Microsoft Purview par le nombre de jours depuis la création du type sensible.
  2. Si le nombre de correspondances par jour est compris entre des centaines de milliers ou plus, il est possible que le sit principal soit trop large.

Pour obtenir des recommandations et des meilleures pratiques sur la sélection du type d’informations sensibles approprié pour un SIT EDM, consultez En savoir plus sur les types d’informations sensibles basés sur la correspondance exacte des données.