Se connecter à Azure Data Lake Gen1 dans Microsoft Purview
Cet article décrit le processus d’inscription d’une source de données Azure Data Lake Storage Gen1 dans Microsoft Purview, y compris des instructions pour s’authentifier et interagir avec la source Azure Data Lake Storage Gen1.
Remarque
Azure Data Lake Storage Gen2 est désormais en disponibilité générale. Nous vous recommandons de commencer à l’utiliser dès aujourd’hui. Pour plus d’informations, consultez la page produit.
Fonctionnalités prises en charge
Extraction de métadonnées | Analyse complète | Analyse incrémentielle | Analyse délimitée | Classification | Étiquetage | Stratégie d’accès | Lignée | Partage de données | Affichage en direct |
---|---|---|---|---|---|---|---|---|---|
Oui | Oui | Oui | Oui | Oui | Oui | Non | Limitée** | Non | Non |
** La traçabilité est prise en charge si le jeu de données est utilisé comme source/récepteur dans Data Factory activité Copy
Configuration requise
Un compte Azure avec un abonnement actif. Créez un compte gratuitement.
Un compte Microsoft Purview actif.
Vous devez être administrateur de source de données et lecteur de données pour inscrire une source et la gérer dans le portail de gouvernance Microsoft Purview. Pour plus d’informations, consultez notre page Autorisations Microsoft Purview .
Inscrire
Cette section vous permet d’inscrire la source de données ADLS Gen1 et de configurer un mécanisme d’authentification approprié pour garantir la réussite de l’analyse de la source de données.
Étapes d’inscription
Il est important d’inscrire la source de données dans Microsoft Purview avant de configurer une analyse pour la source de données.
Ouvrez le portail de gouvernance Microsoft Purview en :
- Accédez directement à https://web.purview.azure.com votre compte Microsoft Purview et sélectionnez-les.
- Ouverture du Portail Azure, recherchez et sélectionnez le compte Microsoft Purview. Sélectionnez le bouton Portail de gouvernance Microsoft Purview .
Accédez à Data Map --> Sources
Créez la hiérarchie collection à l’aide du menu Collections et attribuez des autorisations à des sous-collections individuelles, selon les besoins
Accédez à la collection appropriée sous le menu Sources et sélectionnez l’icône Inscrire pour inscrire une nouvelle source de données ADLS Gen1
Sélectionnez la source de données Azure Data Lake Storage Gen1, puis sélectionnez Continuer
Fournissez un nom approprié pour la source de données, sélectionnez l’abonnement Azure approprié, le nom du compte Data Lake Store existant et la collection , puis sélectionnez Appliquer
Le compte de stockage ADLS Gen1 s’affiche sous la collection sélectionnée
Analyser
Prérequis pour l’analyse
Pour pouvoir analyser la source de données, une méthode d’authentification dans le compte de stockage ADLS Gen1 doit être configurée. Les options suivantes sont prises en charge :
Remarque
Si le pare-feu est activé pour le compte de stockage, vous devez utiliser la méthode d’authentification d’identité managée lors de la configuration d’une analyse.
Identité managée affectée par le système (recommandée) : dès que le compte Microsoft Purview est créé, une identité managée système est créée automatiquement dans le locataire Azure AD. Selon le type de ressource, des attributions de rôles RBAC spécifiques sont requises pour que l’identité SAMI Microsoft Purview effectue les analyses.
Identité managée affectée par l’utilisateur (préversion) : à l’instar d’une identité managée gérée par le système, une identité managée affectée par l’utilisateur est une ressource d’informations d’identification qui peut être utilisée pour permettre à Microsoft Purview de s’authentifier auprès d’Azure Active Directory. Pour plus d’informations, consultez notre guide sur les identités managées affectées par l’utilisateur.
Principal de service : dans cette méthode, vous pouvez créer un principal de service ou utiliser un principal de service existant dans votre locataire Azure Active Directory.
Authentification pour une analyse
Utilisation de l’identité managée affectée par le système ou l’utilisateur pour l’analyse
Il est important de donner à votre compte Microsoft Purview l’autorisation d’analyser la source de données ADLS Gen1. Vous pouvez ajouter l’identité managée système ou l’identité managée affectée par l’utilisateur au niveau de l’abonnement, du groupe de ressources ou de la ressource, en fonction de ce sur quoi vous souhaitez disposer d’autorisations d’analyse.
Remarque
Vous devez être propriétaire de l’abonnement pour pouvoir ajouter une identité managée sur une ressource Azure.
Dans le Portail Azure, recherchez l’abonnement, le groupe de ressources ou la ressource (par exemple, un compte de stockage Azure Data Lake Storage Gen1) que vous souhaitez autoriser l’analyse du catalogue.
Sélectionnez Vue d’ensemble , puis Explorateur de données
Sélectionnez Accès dans le volet de navigation supérieur.
Choisissez Sélectionner et ajoutez le nom Microsoft Purview (qui est l’identité managée système) ou l’identité managée affectée par l’utilisateur (préversion), qui a déjà été inscrite dans Microsoft Purview, dans le menu Sélectionner un utilisateur ou un groupe .
Sélectionnez Autorisations de lecture et d’exécution . Veillez à choisir Ce dossier et tous les enfants, et Une entrée d’autorisation d’accès et une entrée d’autorisation par défaut dans ajouter des options, comme illustré dans la capture d’écran ci-dessous. Sélectionnez OK.
Conseil
Une entrée d’autorisation d’accès est une entrée d’autorisation sur les fichiers et dossiers actuels . Une entrée d’autorisation par défaut est une entrée d’autorisation qui sera héritée par les nouveaux fichiers et dossiers. Pour accorder l’autorisation uniquement aux fichiers existants, choisissez une entrée d’autorisation d’accès. Pour accorder l’autorisation d’analyser les fichiers et dossiers qui seront ajoutés à l’avenir, incluez une entrée d’autorisation par défaut.
Utilisation du principal de service pour l’analyse
Création d’un principal de service
Si vous devez créer un principal de service, il est nécessaire d’inscrire une application dans votre locataire Azure AD et de fournir l’accès au principal de service dans vos sources de données. Votre administrateur général Azure AD ou d’autres rôles tels que Administrateur d’application peuvent effectuer cette opération.
Obtention de l’ID d’application du principal de service
Copiez l’ID d’application (client) présent dans la vue d’ensemble du principal de service déjà créé
Octroi au principal de service de l’accès à votre compte ADLS Gen1
Il est important de donner à votre principal de service l’autorisation d’analyser la source de données ADLS Gen2. Vous pouvez ajouter l’accès au principal de service au niveau de l’abonnement, du groupe de ressources ou de la ressource, en fonction des autorisations dont il a besoin.
Remarque
Vous devez être propriétaire de l’abonnement pour pouvoir ajouter un principal de service sur une ressource Azure.
Fournissez au principal de service l’accès au compte de stockage en ouvrant le compte de stockage et en sélectionnant Vue d’ensemble -->Data Explorer
Sélectionnez Accès dans le volet de navigation supérieur.
Sélectionnez Sélectionner et ajouter le principal de service dans la sélection Sélectionner un utilisateur ou un groupe .
Sélectionnez Autorisations de lecture et d’exécution . Veillez à choisir Ce dossier et tous les enfants, et Une entrée d’autorisation d’accès et une entrée d’autorisation par défaut dans les options Ajouter. Sélectionnez OK.
Création de l’analyse
Ouvrez votre compte Microsoft Purview et sélectionnez le portail de gouvernance Ouvrir Microsoft Purview
Accédez à Data Map -->Sources pour afficher la hiérarchie de collection
Sélectionnez l’icône Nouvelle analyse sous la source de données ADLS Gen1 inscrite précédemment
Si vous utilisez une identité managée affectée par le système ou l’utilisateur
Fournissez un Nom pour l’analyse, sélectionnez le système ou l’identité managée affectée par l’utilisateur sous Informations d’identification, choisissez le regroupement approprié pour l’analyse, puis sélectionnez Tester la connexion. Sur une connexion réussie, sélectionnez Continuer.
Si vous utilisez un principal de service
Fournissez un nom pour l’analyse, choisissez la collection appropriée pour l’analyse, puis sélectionnez + Nouveau sous Informations d’identification
Sélectionnez la connexion de coffre de clés appropriée et le nom du secret utilisé lors de la création du principal de service. L’ID du principal de service est l’ID d’application (client) copié comme indiqué précédemment
Sélectionnez Tester la connexion. Sur une connexion réussie, sélectionnez Continuer
Étendue et exécution de l’analyse
Vous pouvez étendre votre analyse à des dossiers et sous-dossiers spécifiques en choisissant les éléments appropriés dans la liste.
Sélectionnez ensuite un ensemble de règles d’analyse. Vous pouvez choisir entre le système par défaut et les ensembles de règles personnalisés existants ou créer un nouvel ensemble de règles inline.
Si vous créez un ensemble de règles d’analyse, sélectionnez les types de fichiers à inclure dans la règle d’analyse.
Vous pouvez sélectionner les règles de classification à inclure dans la règle d’analyse
Choisissez votre déclencheur d’analyse. Vous pouvez configurer une planification ou exécuter l’analyse une seule fois.
Passez en revue votre analyse et sélectionnez Enregistrer et exécuter.
Affichage de l’analyse
Accédez à la source de données dans la collection et sélectionnez Afficher les détails pour case activée le status de l’analyse
Les détails de l’analyse indiquent la progression de l’analyse dans le status Dernière exécution et le nombre de ressources analysées et classifiées
La dernière status d’exécution est mise à jour sur En cours, puis terminée une fois l’analyse terminée.
Gestion de l’analyse
Les analyses peuvent être gérées ou réexécuter une fois terminées.
Sélectionnez le nom de l’analyse pour gérer l’analyse
Vous pouvez réexécuter l’analyse , modifier l’analyse, supprimer l’analyse
Remarque
- La suppression de votre analyse ne supprime pas les ressources de catalogue créées à partir d’analyses précédentes.
- La ressource ne sera plus mise à jour avec des modifications de schéma si votre table source a changé et que vous réexécuterez la table source après avoir modifié la description dans l’onglet schéma de Microsoft Purview.
Vous pouvez réexécuter une analyse incrémentielle ou une analyse complète .
Prochaines étapes
Maintenant que vous avez inscrit votre source, suivez les guides ci-dessous pour en savoir plus sur Microsoft Purview et vos données.