Créer un ensemble de règles d’analyse

Dans un catalogue Microsoft Purview, vous pouvez créer des ensembles de règles d’analyse pour vous permettre d’analyser rapidement des sources de données dans votre organization.

Un ensemble de règles d’analyse est un conteneur permettant de regrouper un ensemble de règles d’analyse afin que vous puissiez facilement les associer à une analyse. Par exemple, vous pouvez créer un ensemble de règles d’analyse par défaut pour chacun de vos types de sources de données, puis utiliser ces ensembles de règles d’analyse par défaut pour toutes les analyses au sein de votre entreprise. Vous pouvez également souhaiter que les utilisateurs disposant des autorisations appropriées créent d’autres ensembles de règles d’analyse avec différentes configurations en fonction des besoins de l’entreprise.

Étapes de création d’un ensemble de règles d’analyse

Pour créer un ensemble de règles d’analyse :

  1. Dans votre portail de gouvernance Azure Microsoft Purview, sélectionnez Data Map.

  2. Sélectionnez Analyser les ensembles de règles dans le volet gauche, puis sélectionnez Nouveau.

  3. Dans la page Nouvel ensemble de règles d’analyse , sélectionnez les sources de données prises en charge par l’analyseur de catalogue dans la liste déroulante Type de source. Vous pouvez créer un ensemble de règles d’analyse pour chaque type de source de données que vous envisagez d’analyser.

  4. Donnez un nom à votre ensemble de règles d’analyse. La longueur maximale est de 63 caractères, sans espace autorisé. Si vous le souhaitez, entrez une Description. La longueur maximale est de 256 caractères.

    Capture d’écran montrant la page Ensemble de règles d’analyse.

  5. Cliquez sur Continuer.

    La page Sélectionner les types de fichiers s’affiche. Notez que les options de type de fichier sur cette page varient en fonction du type de source de données que vous avez choisi sur la page précédente. Tous les types de fichiers sont activés par défaut.

    Capture d’écran montrant la page Sélectionner les types de fichiers.

    La sélection Types de fichiers document sur cette page vous permet d’inclure ou d’exclure les types de fichiers Office suivants : .doc, .docm, .docx, .dot, .odp, .odt, .odt, .pdf, .pot, .pps, .ppsx, .ppt, .pptm, .pptx, .xlc, .xls, .xlsb, .xlsm, .xlsx et .xlt.

  6. Activez ou désactivez une vignette de type de fichier en sélectionnant ou en désactivant sa zone de case activée. Si vous choisissez une source de données de type Data Lake (par exemple, Azure Data Lake Storage Gen2 ou Objet blob Azure), activez les types de fichiers pour lesquels vous souhaitez que le schéma soit extrait et classifié.

  7. Pour certains types de sources de données, vous pouvez également créer un type de fichier personnalisé.

  8. Cliquez sur Continuer.

    La page Sélectionner les règles de classification s’affiche. Cette page affiche les règles système et les règles personnalisées sélectionnées, ainsi que le nombre total de règles de classification sélectionnées. Par défaut, toutes les zones Règles système case activée sont sélectionnées

  9. Pour les règles que vous souhaitez inclure ou exclure, vous pouvez sélectionner ou effacer la règle de classification des règles système case activée zones globalement par catégorie.

    Capture d’écran montrant la page Sélectionner des règles de classification.

  10. Vous pouvez développer le nœud de catégorie et sélectionner ou effacer des zones de case activée individuelles. Par exemple, si la règle pour Argentina.DNI Number contient des faux positifs élevés, vous pouvez effacer cette zone de case activée spécifique.

    Capture d’écran montrant comment sélectionner des règles système.

  11. Sélectionnez Créer pour terminer la création de l’ensemble de règles d’analyse.

Créer un type de fichier personnalisé

Microsoft Purview prend en charge l’ajout d’une extension personnalisée et la définition d’un délimiteur de colonne personnalisé dans un ensemble de règles d’analyse.

Pour créer un type de fichier personnalisé :

  1. Suivez les étapes 1 à 5 dans Étapes pour créer un ensemble de règles d’analyse ou modifier un ensemble de règles d’analyse existant.

  2. Dans la page Sélectionner les types de fichiers , sélectionnez Nouveau type de fichier pour créer un type de fichier personnalisé.

    Capture d’écran montrant comment sélectionner Nouveau type de fichier dans la page Sélectionner des types de fichiers.

  3. Entrez une extension de fichier et une description facultative.

    Capture d’écran montrant la page Nouveau type de fichier personnalisé.

  4. Effectuez l’une des sélections suivantes pour Le contenu du fichier dans afin de spécifier le type de contenu de fichier dans votre fichier :

    • Sélectionnez Délimiteur personnalisé et entrez votre propre délimiteur personnalisé (caractère unique uniquement).

    • Sélectionnez Type de fichier système et choisissez un type de fichier système (par exemple XML) dans la liste déroulante Type de fichier système .

  5. Sélectionnez Créer pour enregistrer le fichier personnalisé.

    Le système retourne à la page Sélectionner les types de fichiers et insère le nouveau type de fichier personnalisé en tant que nouvelle vignette.

    Capture d’écran montrant la vignette nouveau type de fichier personnalisé dans la page Sélectionner les types de fichiers.

  6. Sélectionnez Modifier dans la vignette du nouveau type de fichier si vous souhaitez le modifier ou le supprimer.

  7. Sélectionnez Continuer pour terminer la configuration de l’ensemble de règles d’analyse.

Ignorer les modèles

Microsoft Purview prend en charge la définition d’expressions régulières (regex) pour exclure des ressources pendant l’analyse. Pendant l’analyse, Microsoft Purview compare l’URL de la ressource à ces expressions régulières. Toutes les ressources correspondant à l’une des expressions régulières mentionnées seront ignorées lors de l’analyse.

Le panneau Ignorer les modèles préremplir une expression régulière pour les fichiers de transaction Spark. Vous pouvez supprimer le modèle préexistant s’il n’est pas nécessaire. Vous pouvez définir jusqu’à 10 modèles d’ignorer.

Capture d’écran montrant le panneau Ignorer les modèles avec quatre expressions régulières définies. La première est l’expression régulière de transaction Spark préremplie, la seconde est \\.txt$, la troisième est \\.csv$, et enfin .folderB/.*.

Dans l’exemple ci-dessus :

  • Les expressions régulières 2 et 3 ignorent tous les fichiers se terminant par .txt et .csv pendant l’analyse.
  • Regex 4 ignore /folderB/ et tout son contenu pendant l’analyse.

Voici quelques conseils supplémentaires que vous pouvez utiliser pour ignorer les modèles :

  • Lors du traitement de l’expression régulière, Microsoft Purview ajoute $ à l’expression régulière par défaut.

  • Un bon moyen de comprendre l’URL que l’agent d’analyse comparera à votre expression régulière consiste à parcourir le catalogue de données Microsoft Purview, à rechercher la ressource que vous souhaitez ignorer à l’avenir et à voir son nom complet (FQN) sous l’onglet Vue d’ensemble .

    Capture d’écran montrant le nom complet sous l’onglet Vue d’ensemble d’une ressource.

Ensembles de règles d’analyse système

Les ensembles de règles d’analyse système sont des ensembles de règles d’analyse définis par Microsoft qui sont créés automatiquement pour chaque catalogue Microsoft Purview. Chaque ensemble de règles d’analyse système est associé à un type de source de données spécifique. Lorsque vous créez une analyse, vous pouvez l’associer à un ensemble de règles d’analyse système. Chaque fois que Microsoft met à jour ces ensembles de règles système, vous pouvez les mettre à jour dans votre catalogue et appliquer la mise à jour à toutes les analyses associées.

  1. Pour afficher la liste des ensembles de règles d’analyse système, sélectionnez Analyser les ensembles de règles dans le Centre de gestion et choisissez l’onglet Système .

    Capture d’écran montrant la liste des ensembles de règles d’analyse système.

  2. Chaque ensemble de règles d’analyse système a un nom, un type de source et une version. Si vous sélectionnez le numéro de version d’un ensemble de règles d’analyse dans la colonne Version , vous voyez les règles associées à la version actuelle et aux versions précédentes (le cas échéant).

    Capture d’écran montrant une page d’ensemble de règles d’analyse système.

  3. Si une mise à jour est disponible pour un ensemble de règles d’analyse système, vous pouvez sélectionner Mettre à jour dans la colonne Version . Dans la page règle d’analyse système, choisissez une version dans la liste déroulante Sélectionner une nouvelle version à mettre à jour . La page fournit une liste des règles de classification système associées à la nouvelle version et à la version actuelle.

    Capture d’écran montrant comment modifier la version d’un ensemble de règles d’analyse système.

Associer une analyse à un ensemble de règles d’analyse système

Lorsque vous créez une analyse, vous pouvez choisir de l’associer à un ensemble de règles d’analyse système comme suit :

  1. Dans la page Sélectionner un ensemble de règles d’analyse , sélectionnez l’ensemble de règles d’analyse système.

    Capture d’écran montrant comment sélectionner un ensemble de règles d’analyse système pour une analyse.

  2. Sélectionnez Continuer, puis Enregistrer et exécuter.