Implémenter la classification des données des informations sensibles en utilisant le portail de gouvernance Microsoft Purview
Gérer des sources de données dans Microsoft Purview
- S’inscrire
- Analyser et ingérer
- Classer
L’étiquetage dans le Mappage de données Microsoft Purview est actuellement en PRÉVERSION.
Avenant aux conditions d'utilisation pour les préversions de Microsoft Azure
Azure peut inclure la préversion, la version bêta ou d’autres fonctionnalités, services, logiciels ou régions proposés par Microsoft pour une évaluation facultative (les « Préversions »). Les préversions sont concédées sous licence dans le cadre de votre contrat régissant l’utilisation d’Azure, et soumises aux conditions applicables aux « Préversions ».
Certaines Préversions nommées sont soumises à des conditions supplémentaires énoncées ci-dessous, le cas échéant. Ces Préversions sont mises à votre disposition conformément à ces conditions supplémentaires, qui complètent votre contrat régissant l’utilisation d’Azure. Les termes avec une majuscule qui ne sont pas définis dans ce document auront la signification définie dans votre contrat. Si vous n’acceptez pas ces conditions, n’utilisez pas la ou les Préversions.
Inscrire une nouvelle source
Remarque
Vous devez être administrateur de source de données et occuper l’un des autres rôles Purview (par exemple, Lecteur de données ou Contributeur de partage de données) pour inscrire une source et la gérer dans le portail de gouvernance Microsoft Purview.
Après avoir inscrit votre source de données dans Microsoft Purview, vous pouvez analyser votre source afin de recueillir les métadonnées techniques, extraire le schéma et appliquer des classifications à vos données.
Conditions préalables
Voici la liste de toutes les sources actuellement disponibles pour l’inscription et l’analyse dans Microsoft Purview.
Avant de pouvoir analyser votre source de données, vous devez effectuer les étapes suivantes :
- Inscrivez votre source de données : cela donne essentiellement à Microsoft Purview l’adresse de votre source de données et la mappe à une collection dans le Mappage de données Microsoft Purview.
- Considérez votre réseau et choisissez la configuration du runtime d’intégration appropriée pour votre scénario.
- Tenez compte des informations d’identification que vous allez utiliser pour vous connecter à votre source. Toutes les pages sources ont une section Analyse qui inclut des détails sur les types d’authentification disponibles.
Analyses et ingestion dans Microsoft Purview
Les fonctionnalités d’analyse et d’ingestion de Microsoft Purview connectent votre compte Microsoft Purview à vos sources pour renseigner le mappage et le catalogue de données. Cela vous permet de commencer à explorer et à gérer vos données via Microsoft Purview.
L’analyse capture les métadonnées des sources de données et les envoie à Microsoft Purview.
L’ingestion traite les métadonnées et les stocke dans le catalogue de données à partir des deux :
- Analyses de la source de données : les métadonnées analysées sont ajoutées au Mappage de données Microsoft Purview.
- Connexions de traçabilité : les ressources de transformation ajoutent des métadonnées sur les sources, les sorties et les activités connexes au Mappage de données Microsoft Purview.
Analyse
Une fois que les sources de données sont inscrites dans votre compte Microsoft Purview, l’étape suivante consiste à analyser les sources de données. Le processus d’analyse établit une connexion à la source de données et capture les métadonnées techniques (comme les noms, la taille de fichier, les colonnes, etc.). Il extrait également le schéma des sources de données structurées, applique des classifications sur les schémas et applique des étiquettes de confidentialité si le Mappage de données Microsoft Purview est connecté à un portail de conformité Microsoft Purview. Pour maintenir votre compte Microsoft Purview à jour, vous pouvez déclencher le processus d’analyse de sorte qu’il s’exécute immédiatement ou planifier une exécution périodique.
Pour chaque analyse, vous pouvez appliquer des personnalisations. Cela vous permet d’analyser uniquement les informations dont vous avez besoin, plutôt que l’ensemble de la source.
Créer un ensemble de règles d’analyse
Dans un catalogue Microsoft Purview, vous pouvez créer des ensembles de règles d’analyse pour analyser rapidement les sources de données au sein de l’organisation.
Un ensemble de règles d’analyse est un conteneur permettant de regrouper un ensemble de règles d’analyse, afin que vous puissiez facilement les associer à une analyse. Par exemple, vous pouvez créer un ensemble de règles d’analyse par défaut pour chacun des types de sources de données, puis utiliser ces ensembles de règles d’analyse par défaut pour toutes les analyses au sein de votre société. Vous pouvez également souhaiter que les utilisateurs qui disposent des autorisations appropriées puissent créer d’autres ensembles de règles d’analyse avec des configurations différentes, en fonction des besoins de l’entreprise.
Créer des ensembles de règles d’analyse
Les ensembles de règles d’analyse système sont des ensembles de règles d’analyse définis par Microsoft qui sont créés automatiquement pour chaque catalogue Microsoft Purview. Chaque jeu de règles d’analyse système est associé à un type de source de données spécifique. Lorsque vous créez une analyse, vous pouvez l’associer à un ensemble de règles d’analyse système. Chaque fois que Microsoft met à jour ces ensembles de règles système, vous pouvez les mettre à jour dans votre catalogue et appliquer la mise à jour à toutes les analyses associées.
Classifier : classification des données sur le portail de gouvernance Microsoft Purview
Sur le portail de gouvernance Microsoft Purview, la classification des données permet de classer les ressources de données par catégories en leur attribuant des classes ou des étiquettes logiques uniques. La classification repose sur le contexte métier des données. Par exemple, vous pouvez classifier des ressources par numéro de passeport, numéro de permis de conduire, numéro de carte de crédit, code SWIFT, nom de personne, etc.
Lorsque vous classifiez les ressources de données, vous pouvez les comprendre, les rechercher et les gérer plus facilement. La classification des ressources de données vous aide également à comprendre les risques associés. Cela peut vous aider à implémenter des mesures pour protéger les données sensibles ou importantes contre la prolifération anarchique et l’accès non autorisé dans le patrimoine de données.
Le Mappage de données Microsoft Purview fournit une fonctionnalité de classification automatisée pendant l’analyse des sources de données. Vous bénéficiez de plus de 200 classifications système intégrées et de la possibilité de créer des classifications personnalisées pour vos données. Vous pouvez classer automatiquement les ressources lorsqu’elles sont ingérées dans le cadre d’une analyse configurée. Vous pouvez aussi les modifier manuellement dans le portail de gouvernance Microsoft Purview une fois qu’elles ont été analysées et ingérées.
Usages de la classification
La classification désigne le processus d’organisation des données en catégories logiques qui facilitent la récupération, le tri et l’identification des données pour une utilisation ultérieure. Elle peut être importante pour la gouvernance des données. La classification des ressources de données est importante pour plusieurs raisons. Elle vous aide notamment à :
- Affiner la recherche des ressources de données qui vous intéressent.
- Organiser et identifier l’ensemble des classes de données qui importent à votre organisation, et déterminer leur emplacement de stockage.
- Identifier les risques associés à vos ressources de données les plus importantes, puis adopter les mesures appropriées pour les atténuer.
Types de classification
Le portail de gouvernance Microsoft Purview prend en charge les classifications système et personnalisées.
- Classifications système : les plus de 200 classifications système prises en charge sont prêtes à l’emploi.
Dans l’exemple de l’image précédente, « Nom de la personne » est une classification système. Les classifications système portent une icône en forme de foudre en regard du nom de la classification. Placez le curseur sur la classification pour obtenir plus de détails sur le type de classification et sur la façon dont elle a été appliquée. - Classifications personnalisées : vous pouvez créer des classifications personnalisées lorsque vous souhaitez classifier des ressources en fonction d’un modèle ou d’un nom de colonne spécifique qui n’est pas disponible en tant que classification système. Les règles de classification personnalisées peuvent être basées sur un modèle d’expression régulière ou un dictionnaire.
Par exemple : la colonne « ID collaborateur » suit le modèle EMPLOYEE{GUID} (EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55). Vous pouvez créer votre propre classification personnalisée avec une expression régulière, comme \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$.
Remarque
les étiquettes de confidentialité sont différentes des classifications. Les étiquettes de confidentialité catégorisent les ressources dans un contexte de sécurité et de confidentialité des données (Hautement confidentielles, Restreintes, Publiques, etc.). Pour utiliser les étiquettes de confidentialité dans le Mappage de données Microsoft Purview, vous devez disposer d’au moins une licence ou un compte Microsoft 365 dans le même locataire Microsoft Entra que votre Mappage de données Microsoft Purview.
Étiquetage dans Microsoft Purview Data Map
Important
L’étiquetage dans le Mappage de données Microsoft Purview est actuellement en PRÉVERSION. L’avenant aux conditions d’utilisation pour les préversions de Microsoft Azure inclue les conditions juridiques supplémentaires s’appliquant aux fonctionnalités Azure sont en version bêta, en préversion ou non encore en disponibilité générale.
Dans le cadre de leur travail, les membres de votre organisation collaborent avec d’autres personnes à l’intérieur de l’organisation et à l’extérieur. Les données ne restent pas toujours dans votre cloud et se déplacent souvent partout, sur les appareils, les applications et les services. L’itinérance des données doit être sécurisée et conforme aux stratégies de votre organisation.
L’application d’étiquettes de confidentialité à votre contenu vous permet de protéger vos données en indiquant le niveau de confidentialité de certaines données dans votre organisation. Ce procédé extrait par ailleurs les données elles-mêmes. Vous utilisez ainsi des étiquettes pour suivre le type des données, sans exposer les données sensibles sur une autre plateforme.
Par exemple, l’application d’une étiquette de confidentialité « Hautement confidentiel » à un document qui inclut des numéros de sécurité sociale et de carte bancaire vous permet d’identifier le niveau de confidentialité du document sans connaître les données réelles dans le document.
Avantages de l’étiquetage dans Microsoft Purview
Microsoft Purview vous permet d’appliquer des étiquettes de confidentialité aux ressources, ce qui vous permet de classifier et de protéger vos données.
- Les étiquettes voyagent avec les données : les étiquettes de confidentialité créées dans Protection des données Microsoft Purview peuvent également être étendues à la carte de données Microsoft Purview, SharePoint, Teams, Power BI et SQL. Lorsque vous appliquez une étiquette à un document Office, puis que vous le numérisez dans Microsoft Purview Data Map, l'étiquette est appliquée à la ressource de données. Bien que l’étiquette soit appliquée au fichier réel dans Protection des données Microsoft Purview, elle est ajoutée uniquement en tant que métadonnées dans la carte Microsoft Purview. Bien qu’il existe des différences dans la façon dont une étiquette est appliquée à une ressource entre différents services/applications, les étiquettes voyagent avec les données et sont reconnues par tous les services auxquels vous l’étendez.
- Vue d’ensemble de votre patrimoine de données : Microsoft Purview fournit des insights sur vos données via des rapports prédéfinis. Lorsque vous analysez des données dans le mappage de données Microsoft Purview, nous hydratons les rapports avec des informations sur les ressources dont vous disposez, l’historique d’analyse, les classifications trouvées dans vos données, les étiquettes appliquées, les termes du glossaire, etc.
- Étiquetage automatique : les étiquettes peuvent être appliquées automatiquement en fonction de la sensibilité des données. Lorsqu’une ressource est analysée à la recherche de données sensibles, les règles d’étiquetage automatique sont utilisées pour déterminer l’étiquette de confidentialité à appliquer. Vous pouvez créer des règles d’étiquetage automatique pour chaque étiquette de confidentialité, en définissant quel type de classification/d’informations sensibles constitue une étiquette.
- Appliquer les étiquettes aux fichiers et aux colonnes de base de données : les étiquettes peuvent être appliquées aux fichiers dans le stockage, tels qu’Azure Data Lake ou Azure Files, ainsi qu’aux données schématisées telles que des colonnes dans Azure SQL Database.
Les étiquettes de confidentialité sont des étiquettes que vous pouvez appliquer aux ressources pour classifier et protéger vos données.
Comment appliquer des étiquettes à des ressources dans le mappage de données Microsoft Purview
La possibilité d’appliquer des étiquettes à votre ressource dans le mappage de données vous oblige à effectuer les étapes suivantes :
- Créez ou appliquez des étiquettes de confidentialité existantes dans le portail de conformité Microsoft Purview. La création d’étiquettes de confidentialité inclut des règles d’étiquetage automatique qui nous indiquent quelle étiquette doit être appliquée en fonction des classifications trouvées dans vos données.
- Inscrivez et analysez votre ressource dans le mappage de données Microsoft Purview.
- Microsoft Purview applique des classifications : lorsque vous planifiez une analyse sur une ressource, Microsoft Purview analyse le type de données de votre ressource et lui applique des classifications dans le mappage de données. L’application des classifications est effectuée automatiquement par Microsoft Purview, vous n’avez rien à faire.
- Microsoft Purview applique des étiquettes : une fois des classifications trouvées sur une ressource, Microsoft Purview applique des étiquettes aux ressources en fonction des règles d’étiquetage automatique. L’application des étiquettes est effectuée automatiquement par Microsoft Purview : aucune action n’est nécessaire de votre part dès lors que vous avez créé des étiquettes avec des règles d’étiquetage automatique dans la première étape.
Remarque
Les règles d’étiquetage automatique sont des conditions que vous spécifiez, indiquant quand une étiquette particulière doit être appliquée. Lorsque ces conditions sont réunies, l’étiquette est attribuée automatiquement aux données. Lorsque vous créez vos étiquettes, veillez à définir des règles d’étiquetage automatique pour les fichiers et les colonnes de base de données pour appliquer automatiquement vos étiquettes à chaque analyse.
Étiquetage pour les bases de données SQL
Outre l’étiquetage de Mappage de données Microsoft Purview pour les ressources de données schématisées, Microsoft prend également en charge l’étiquetage pour les colonnes de base de données SQL à l’aide de la classification des données SQL dans SQL Server Management Studio (SSMS). Bien que Microsoft Purview utilise les étiquettes de confidentialité globales, SSMS utilise uniquement les étiquettes définies localement.
L’étiquetage dans Microsoft Purview et l’étiquetage dans SSMS sont des processus distincts qui n’interagissent pas entre eux. Par conséquent, les étiquettes appliquées dans SSMS ne sont pas affichées dans Microsoft Purview, et vice versa. Nous vous recommandons Microsoft Purview pour étiqueter des bases de données SQL, car les étiquettes peuvent être appliquées globalement sur plusieurs plateformes.