Créer un cluster avec Data Lake Storage Gen2 à partir du portail Azure

Le portail Azure est un outil web qui permet de gérer les services et les ressources hébergés dans le cloud Microsoft Azure. Cet article vous montre comment créer des clusters Azure HDInsight Linux par le biais du portail. Des informations supplémentaires sont disponibles dans Créer des clusters HDInsight.

Avertissement

La facturation des clusters HDInsight est calculée au prorata des minutes écoulées, que vous les utilisiez ou non. Veillez à supprimer votre cluster une fois que vous avez terminé de l’utiliser. Consultez Guide pratique pour supprimer un cluster HDInsight.

Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.

Pour créer un cluster HDInsight qui utilise Data Lake Storage Gen2 comme stockage, effectuez les étapes suivantes pour configurer un compte qui dispose d’un espace de noms hiérarchique.

Créer une identité managée attribuée par l’utilisateur

Créez une identité managée affectée à l’utilisateur, si vous n’en avez pas encore.

  1. Connectez-vous au portail Azure.
  2. Dans le coin supérieur gauche, cliquez sur Créer une ressource.
  3. Dans la zone de recherche, tapez user assigned (utilisateur affecté) , puis cliquez sur Identité managée affectée par l'utilisateur.
  4. Cliquez sur Créer.
  5. Entrez un nom pour votre identité managée, sélectionnez l'abonnement, le groupe de ressources et l'emplacement correspondants.
  6. Cliquez sur Créer.

Pour plus d’informations sur le fonctionnement des identités managées dans Azure HDInsight, consultez Identités managées dans Azure HDInsight.

Create a user-assigned managed identity.

Créer un compte de stockage à utiliser avec Data Lake Storage Gen2

Créez un compte de stockage à utiliser avec Data Lake Storage Gen2.

  1. Connectez-vous au portail Azure.
  2. Dans le coin supérieur gauche, cliquez sur Créer une ressource.
  3. Dans la zone de recherche, tapez stockage, puis cliquez sur compte de stockage.
  4. Cliquez sur Créer.
  5. Sur l'écran Créer un compte de stockage :
    1. Sélectionnez l’abonnement et le groupe de ressources correspondants.
    2. Attribuez un nom à votre compte de stockage avec Data Lake Storage Gen2.
    3. Cliquez sur l’onglet Avancé.
    4. Cliquez sur Activé en regard de Espace de noms hiérarchique sous Data Lake Storage Gen2.
    5. Cliquez sur Vérifier + créer.
    6. Cliquez sur Créer

Pour plus d'informations sur les autres options lors de la création d'un compte de stockage, voir Démarrage rapide : Créez un compte de stockage pour Azure Data Lake Storage Gen2.

Screenshot showing storage account creation in the Azure portal.

Définir des autorisations pour l’identité managée sur Data Lake Storage Gen2

Affectez l’identité managée au rôle Propriétaire des données Blob du stockage sur le compte de stockage.

  1. Dans le portail Azure, accédez à votre compte de stockage.

  2. Sélectionnez Contrôle d’accès (IAM) .

  3. Sélectionner Ajouter> Ajouter une attribution de rôle.

    Screenshot showing Access control (IAM) page with Add role assignment menu open.

  4. Sous l’onglet Rôle, sélectionnez Propriétaire des données de blob de stockage.

    Screenshot showing Add role assignment page with Role tab selected.

  5. Sous l’onglet Membres, sélectionnez Identité managée, puis Sélectionner des membres.

  6. Sélectionnez votre abonnement, sélectionnez Identité managée affectée par l’utilisateur, puis votre identité managée affectée par l’utilisateur.

  7. Dans l’onglet Passer en revue + affecter, sélectionnez Passer en revue + affecter pour affecter le rôle.

    L’identité affectée par l’utilisateur que vous avez sélectionnée est maintenant listée sous le rôle sélectionné.

    Pour plus d’informations sur l’attribution de rôle, consultez Attribuer des rôles Azure à l’aide du Portail Azure

  8. Une fois cette configuration initiale terminée, vous pouvez créer un cluster par le biais du portail. Le cluster doit être dans la même région Azure que le compte de stockage. Sous l’onglet Stockage du menu de création du cluster, sélectionnez les options suivantes :

    • Comme Type de stockage principal, sélectionnez Azure Data Lake Storage Gen2.

    • Sous Compte de stockage principal, recherchez et sélectionnez le compte de stockage nouvellement créé avec le stockage Data Lake Storage Gen2.

    • Sous Identité, sélectionnez l’identité managée affectée par l’utilisateur nouvellement créée.

      Storage settings for using Data Lake Storage Gen2 with Azure HDInsight.

    Remarque

    • Pour ajouter un compte de stockage secondaire avec Data Lake Storage Gen2, au niveau du compte de stockage, attribuez simplement l’identité managée créée précédemment au nouveau Data Lake Storage Gen2 que vous voulez ajouter. Sachez que l’ajout d’un compte de stockage secondaire avec Data Lake Storage Gen2 via le panneau « Comptes de stockage supplémentaires » de HDInsight n’est pas pris en charge.
    • Vous pouvez activer RA-GRS ou RA-ZRS sur le compte Stockage Blob Azure utilisé par HDInsight. La création d’un cluster sur le point de terminaison secondaire RA-GRS ou RA-ZRS n’est toutefois pas prise en charge.
    • HDInsight ne prend pas en charge la définition de Data Lake Storage Gen2 en tant que stockage géo-redondant interzone avec accès en lecture (RA-GZRS) ou stockage géo-redondant interzone (GZRS).

Supprimer le cluster

Consultez Suppression d’un cluster HDInsight avec votre navigateur, PowerShell ou l’interface de ligne de commande Azure.

Dépanner

Si vous rencontrez des problèmes lors de la création de clusters HDInsight, reportez-vous aux exigences de contrôle d’accès.

Étapes suivantes

Vous avez créé un cluster HDInsight. Apprenez maintenant à l’utiliser.

Clusters Apache Spark

Clusters Apache Hadoop

Clusters Apache HBase