Se connecter à Azure Data Lake Gen1 dans Microsoft Purview

Cet article décrit le processus d’inscription d’une source de données Azure Data Lake Storage Gen1 dans Microsoft Purview, y compris des instructions pour s’authentifier et interagir avec la source Azure Data Lake Storage Gen1.

Remarque

Azure Data Lake Storage Gen2 est désormais en disponibilité générale. Nous vous recommandons de commencer à l’utiliser dès aujourd’hui. Pour plus d’informations, consultez la page produit.

Fonctionnalités prises en charge

Extraction de métadonnées Analyse complète Analyse incrémentielle Analyse délimitée Classification Étiquetage Stratégie d’accès Lignée Partage de données Affichage en direct
Oui Oui Oui Oui Oui Oui Non Limitée** Non Non

** La traçabilité est prise en charge si le jeu de données est utilisé comme source/récepteur dans Data Factory activité Copy

Configuration requise

Inscrire

Cette section vous permet d’inscrire la source de données ADLS Gen1 et de configurer un mécanisme d’authentification approprié pour garantir la réussite de l’analyse de la source de données.

Étapes d’inscription

Il est important d’inscrire la source de données dans Microsoft Purview avant de configurer une analyse pour la source de données.

  1. Ouvrez le portail de gouvernance Microsoft Purview en :

  2. Accédez à Data Map --> Sources

    Capture d’écran montrant le lien pour ouvrir le portail de gouvernance Microsoft Purview

    Capture d’écran qui accède au lien Sources dans data map

  3. Créez la hiérarchie collection à l’aide du menu Collections et attribuez des autorisations à des sous-collections individuelles, selon les besoins

    Capture d’écran montrant le menu de collection pour créer une hiérarchie de regroupements

  4. Accédez à la collection appropriée sous le menu Sources et sélectionnez l’icône Inscrire pour inscrire une nouvelle source de données ADLS Gen1

    Capture d’écran montrant la collection utilisée pour inscrire la source de données

  5. Sélectionnez la source de données Azure Data Lake Storage Gen1, puis sélectionnez Continuer

    Capture d’écran qui autorise la sélection de la source de données

  6. Fournissez un nom approprié pour la source de données, sélectionnez l’abonnement Azure approprié, le nom du compte Data Lake Store existant et la collection , puis sélectionnez Appliquer

    Capture d’écran montrant les détails à entrer pour inscrire la source de données

  7. Le compte de stockage ADLS Gen1 s’affiche sous la collection sélectionnée

    Capture d’écran montrant la source de données mappée à la collection pour lancer l’analyse

Analyser

Prérequis pour l’analyse

Pour pouvoir analyser la source de données, une méthode d’authentification dans le compte de stockage ADLS Gen1 doit être configurée. Les options suivantes sont prises en charge :

Remarque

Si le pare-feu est activé pour le compte de stockage, vous devez utiliser la méthode d’authentification d’identité managée lors de la configuration d’une analyse.

  • Identité managée affectée par le système (recommandée) : dès que le compte Microsoft Purview est créé, une identité managée système est créée automatiquement dans le locataire Azure AD. Selon le type de ressource, des attributions de rôles RBAC spécifiques sont requises pour que l’identité SAMI Microsoft Purview effectue les analyses.

  • Identité managée affectée par l’utilisateur (préversion) : à l’instar d’une identité managée gérée par le système, une identité managée affectée par l’utilisateur est une ressource d’informations d’identification qui peut être utilisée pour permettre à Microsoft Purview de s’authentifier auprès d’Azure Active Directory. Pour plus d’informations, consultez notre guide sur les identités managées affectées par l’utilisateur.

  • Principal de service : dans cette méthode, vous pouvez créer un principal de service ou utiliser un principal de service existant dans votre locataire Azure Active Directory.

Authentification pour une analyse

Utilisation de l’identité managée affectée par le système ou l’utilisateur pour l’analyse

Il est important de donner à votre compte Microsoft Purview l’autorisation d’analyser la source de données ADLS Gen1. Vous pouvez ajouter l’identité managée système ou l’identité managée affectée par l’utilisateur au niveau de l’abonnement, du groupe de ressources ou de la ressource, en fonction de ce sur quoi vous souhaitez disposer d’autorisations d’analyse.

Remarque

Vous devez être propriétaire de l’abonnement pour pouvoir ajouter une identité managée sur une ressource Azure.

  1. Dans le Portail Azure, recherchez l’abonnement, le groupe de ressources ou la ressource (par exemple, un compte de stockage Azure Data Lake Storage Gen1) que vous souhaitez autoriser l’analyse du catalogue.

  2. Sélectionnez Vue d’ensemble , puis Explorateur de données

    Capture d’écran montrant le compte de stockage

  3. Sélectionnez Accès dans le volet de navigation supérieur.

    Capture d’écran montrant l’Explorateur de données pour le compte de stockage

  4. Choisissez Sélectionner et ajoutez le nom Microsoft Purview (qui est l’identité managée système) ou l’identité managée affectée par l’utilisateur (préversion), qui a déjà été inscrite dans Microsoft Purview, dans le menu Sélectionner un utilisateur ou un groupe .

  5. Sélectionnez Autorisations de lecture et d’exécution . Veillez à choisir Ce dossier et tous les enfants, et Une entrée d’autorisation d’accès et une entrée d’autorisation par défaut dans ajouter des options, comme illustré dans la capture d’écran ci-dessous. Sélectionnez OK.

    Capture d’écran montrant les détails permettant d’attribuer des autorisations pour le compte Microsoft Purview

Conseil

Une entrée d’autorisation d’accès est une entrée d’autorisation sur les fichiers et dossiers actuels . Une entrée d’autorisation par défaut est une entrée d’autorisation qui sera héritée par les nouveaux fichiers et dossiers. Pour accorder l’autorisation uniquement aux fichiers existants, choisissez une entrée d’autorisation d’accès. Pour accorder l’autorisation d’analyser les fichiers et dossiers qui seront ajoutés à l’avenir, incluez une entrée d’autorisation par défaut.

Utilisation du principal de service pour l’analyse

Création d’un principal de service

Si vous devez créer un principal de service, il est nécessaire d’inscrire une application dans votre locataire Azure AD et de fournir l’accès au principal de service dans vos sources de données. Votre administrateur général Azure AD ou d’autres rôles tels que Administrateur d’application peuvent effectuer cette opération.

Obtention de l’ID d’application du principal de service
  1. Copiez l’ID d’application (client) présent dans la vue d’ensemble du principal de service déjà créé

    Capture d’écran montrant l’ID d’application (client) pour le principal de service

Octroi au principal de service de l’accès à votre compte ADLS Gen1

Il est important de donner à votre principal de service l’autorisation d’analyser la source de données ADLS Gen2. Vous pouvez ajouter l’accès au principal de service au niveau de l’abonnement, du groupe de ressources ou de la ressource, en fonction des autorisations dont il a besoin.

Remarque

Vous devez être propriétaire de l’abonnement pour pouvoir ajouter un principal de service sur une ressource Azure.

  1. Fournissez au principal de service l’accès au compte de stockage en ouvrant le compte de stockage et en sélectionnant Vue d’ensemble -->Data Explorer

    Capture d’écran montrant le compte de stockage

  2. Sélectionnez Accès dans le volet de navigation supérieur.

    Capture d’écran montrant l’Explorateur de données pour le compte de stockage

  3. Sélectionnez Sélectionner et ajouter le principal de service dans la sélection Sélectionner un utilisateur ou un groupe .

  4. Sélectionnez Autorisations de lecture et d’exécution . Veillez à choisir Ce dossier et tous les enfants, et Une entrée d’autorisation d’accès et une entrée d’autorisation par défaut dans les options Ajouter. Sélectionnez OK.

    Capture d’écran montrant les détails d’attribution d’autorisations pour le principal de service

Création de l’analyse

  1. Ouvrez votre compte Microsoft Purview et sélectionnez le portail de gouvernance Ouvrir Microsoft Purview

  2. Accédez à Data Map -->Sources pour afficher la hiérarchie de collection

    Capture d’écran montrant la hiérarchie de collection

  3. Sélectionnez l’icône Nouvelle analyse sous la source de données ADLS Gen1 inscrite précédemment

    Capture d’écran montrant la source de données avec l’icône nouvelle analyse

Si vous utilisez une identité managée affectée par le système ou l’utilisateur

Fournissez un Nom pour l’analyse, sélectionnez le système ou l’identité managée affectée par l’utilisateur sous Informations d’identification, choisissez le regroupement approprié pour l’analyse, puis sélectionnez Tester la connexion. Sur une connexion réussie, sélectionnez Continuer.

Capture d’écran montrant l’option d’identité managée pour exécuter l’analyse

Si vous utilisez un principal de service

  1. Fournissez un nom pour l’analyse, choisissez la collection appropriée pour l’analyse, puis sélectionnez + Nouveau sous Informations d’identification

    Capture d’écran montrant l’option de principal de service

  2. Sélectionnez la connexion de coffre de clés appropriée et le nom du secret utilisé lors de la création du principal de service. L’ID du principal de service est l’ID d’application (client) copié comme indiqué précédemment

    Capture d’écran montrant l’option de coffre de clés du principal de service

  3. Sélectionnez Tester la connexion. Sur une connexion réussie, sélectionnez Continuer

    Capture d’écran montrant le test de connexion pour le principal de service

Étendue et exécution de l’analyse

  1. Vous pouvez étendre votre analyse à des dossiers et sous-dossiers spécifiques en choisissant les éléments appropriés dans la liste.

    Définir l’étendue de votre analyse

  2. Sélectionnez ensuite un ensemble de règles d’analyse. Vous pouvez choisir entre le système par défaut et les ensembles de règles personnalisés existants ou créer un nouvel ensemble de règles inline.

    Ensemble de règles d’analyse

  3. Si vous créez un ensemble de règles d’analyse, sélectionnez les types de fichiers à inclure dans la règle d’analyse.

    Types de fichiers de l’ensemble de règles d’analyse

  4. Vous pouvez sélectionner les règles de classification à inclure dans la règle d’analyse

    Règles de classification de l’ensemble de règles d’analyse

    Sélection de l’ensemble de règles d’analyse

  5. Choisissez votre déclencheur d’analyse. Vous pouvez configurer une planification ou exécuter l’analyse une seule fois.

    déclencheur d’analyse

    sélection du déclencheur d’analyse

  6. Passez en revue votre analyse et sélectionnez Enregistrer et exécuter.

    analyse de révision

Affichage de l’analyse

  1. Accédez à la source de données dans la collection et sélectionnez Afficher les détails pour case activée le status de l’analyse

    afficher l’analyse

  2. Les détails de l’analyse indiquent la progression de l’analyse dans le status Dernière exécution et le nombre de ressources analysées et classifiées

    afficher les détails de l’analyse

  3. La dernière status d’exécution est mise à jour sur En cours, puis terminée une fois l’analyse terminée.

    afficher l’analyse en cours

    afficher l’analyse terminée

Gestion de l’analyse

Les analyses peuvent être gérées ou réexécuter une fois terminées.

  1. Sélectionnez le nom de l’analyse pour gérer l’analyse

    gérer l’analyse

  2. Vous pouvez réexécuter l’analyse , modifier l’analyse, supprimer l’analyse

    gérer les options d’analyse

    Remarque

    • La suppression de votre analyse ne supprime pas les ressources de catalogue créées à partir d’analyses précédentes.
    • La ressource ne sera plus mise à jour avec des modifications de schéma si votre table source a changé et que vous réexécuterez la table source après avoir modifié la description dans l’onglet schéma de Microsoft Purview.
  3. Vous pouvez réexécuter une analyse incrémentielle ou une analyse complète .

    gérer l’analyse complète ou incrémentielle

    gérer les résultats de l’analyse

Prochaines étapes

Maintenant que vous avez inscrit votre source, suivez les guides ci-dessous pour en savoir plus sur Microsoft Purview et vos données.