Produits de données dans Microsoft Purview
Un produit de données est un groupe de ressources de données (tables, fichiers, rapports PBI, etc.), une offre empaquetée destinée à une entreprise qui fournit des ressources avec un cas d’usage à partager avec les consommateurs de données.
Dans Microsoft Purview, la gouvernance des données n’est pas seulement un moyen de s’assurer que vos données sont sécurisées et conformes, mais également un outil pour accélérer la valeur métier de vos données. Le catalogage des données dans votre patrimoine permet de mieux gérer les données pour une utilisation appropriée, mais il fournit également une image complète de votre paysage de données. Maintenant qu’il existe une liste de chaque ressource de données disponible, les utilisateurs n’ont plus besoin de s’appuyer sur la mise en réseau ou les connaissances de l’équipe pour trouver ce dont ils ont besoin. ils peuvent rechercher eux-mêmes dans le catalogue. Mais donner à chaque utilisateur une liste brute de toutes les données disponibles est écrasant et n’est pas intrinsèquement utile. Même avec de bonnes descriptions, des balises et des termes de glossaire, il peut être difficile de savoir ce que vous recherchez. Et pour une visualisation complète des données, vous avez probablement besoin de plusieurs ressources de données, et pas d’une seule. À mesure que votre catalogue de données s’agrandit, le contexte doit croître parallèlement pour permettre à vos utilisateurs de trouver et de demander l’accès aux données dont ils ont besoin plus facilement.
Pour fournir un contexte de données évolutif et une gestion des accès, Microsoft Purview introduit le produit de données.
Qu’est-ce qu’un produit de données ?
Un produit de données est un concept métier avec un nom, une description, des propriétaires et, plus important encore, une liste de ressources de données associées. Le produit de données fournit un contexte pour ces ressources, en les regroupant sous un cas d’usage pour les consommateurs de données. Un domaine de gouvernance peut héberger de nombreux produits de données, mais un produit de données est géré par un seul domaine de gouvernance et peut être découvert dans de nombreux domaines.
Un produit de données réussi permet aux consommateurs de données de reconnaître facilement les données précieuses à l’aide de leur langage quotidien, tout en rationalise les responsabilités de propriété pour ces ressources de données. Voyons à quoi cela ressemble.
Contexte de données évolutif
Par exemple, un scientifique des données crée un ensemble de ressources de données que son modèle de données doit utiliser et souhaite que d’autres personnes puissent utiliser le même jeu de données.
Sans produits de données, le scientifique des données peut utiliser le catalogue de données pour ajouter un terme de glossaire à toutes les ressources de données pertinentes. Un utilisateur peut ne pas savoir quel terme de glossaire rechercher. Il peut donc être préférable d’ajouter une description à chaque ressource de données pour la rendre plus pertinente dans les recherches d’informations similaires. Toutefois, les deux ajouts ne garantissent pas que les autres utilisateurs verront toutes les ressources de données associées. Ils peuvent se regrouper dans d’autres ressources qui ne sont pas aussi pertinentes, ou manquer un élément de données critique, et passer du temps à répéter la recherche que le scientifique des données d’origine a déjà effectuée.
Avec un produit de données, un scientifique des données peut créer un produit de données qui répertorie toutes les ressources utilisées pour créer son modèle de données. La description fournit un cas d’usage complet, avec des exemples ou des suggestions sur la façon d’utiliser les données. Le scientifique des données est maintenant propriétaire du produit de données et il a amélioré l’expérience de recherche de son consommateur de données en l’aidant à obtenir tout ce dont il a besoin dans ce produit de données.
Gouvernance des données évolutive
Les produits de données simplifient également la gouvernance des ressources de données. En utilisant le même exemple de scientifique des données qui crée un ensemble de ressources de données :
Sans produits de données, si un utilisateur souhaite accéder aux ressources de données du jeu de données, il doit demander l’accès à chaque ressource de données individuellement. Un propriétaire de données peut savoir que ces ressources sont utilisées pour les modèles Machine Learning, mais si des modifications sont apportées aux stratégies relatives à sa sécurité et à ses cas d’usage, le propriétaire des données doit accéder à chaque ressource individuellement pour effectuer ces mises à jour.
Avec les produits de données, un utilisateur trouve le produit de données, il peut demander l’accès au produit de données, ce qui lui donnera accès (après approbation) à toutes les ressources de données associées. Si d’autres stratégies d’approbation ou d’utilisation des données sont mises en place autour des jeux de données pour le Machine Learning, un propriétaire de données doit uniquement appliquer les nouvelles stratégies au produit de données, et elles sont automatiquement appliquées aux ressources.
Les produits de données sont également associés aux contrôles d’intégrité de l’entreprise et aux OKR. Ces contrôles permettent aux propriétaires de données d’évaluer l’intégrité des données et de hiérarchiser les ressources qui nécessitent une attention particulière, et d’évaluer les ressources de données qui fournissent une valeur métier. Cela prend en charge non seulement la progression vers une gouvernance complète des données dans votre patrimoine, mais encourage également le développement de la valeur métier à partir de vos données. Les ressources ne sont plus abstraites, mais liées à des cas d’usage réels et à des objectifs métier sur utilisant votre équipe.
Stratégies d’accès aux données
La sécurité et l’accès aux données sont le principal locataire d’une gouvernance des données réussie. Toutefois, pour implémenter la gouvernance des données et favoriser l’utilisation des données (et donc la valeur), le processus d’accès aux données doit être sécurisé, pratique et personnalisable pour tous les scénarios de votre patrimoine de données. Certaines données doivent être largement utilisables et accessibles, et d’autres doivent faire l’objet d’une approbation et d’une surveillance rigoureuses pour garantir une utilisation appropriée.
Chaque produit de données a une stratégie d’accès qui détermine la façon dont les utilisateurs demandent l’accès, les conditions d’utilisation des données et qui doit approuver l’accès aux données. Chacune de ces stratégies d’accès est personnalisable pour une utilisation appropriée et évoluera pour couvrir d’autres cas d’usage à l’avenir. Tout ce que les utilisateurs doivent faire est de sélectionner Demander l’accès à l’intérieur d’un produit de données et ils seront automatiquement passés par le processus pour accepter les conditions d’utilisation et obtenir l’approbation des parties appropriées.
Pour plus d’informations sur l’accès aux produits de données, consultez l’article sur la gestion des stratégies d’accès au catalogue de données dans Microsoft Purview.