Partage via


Créer un pool de clusters et un cluster

HDInsight sur AKS dispose du concept de pools de clusters et de clusters.

  • Des pools de clusters sont un regroupement logique de clusters et gèrent un ensemble de clusters dans le même pool, ce qui permet de générer une interopérabilité robuste entre plusieurs types de clusters. Ils peuvent être créés dans un réseau virtuel existant ou en dehors d’un réseau virtuel.

    Un pool de clusters dans HDInsight sur AKS correspond à un seul cluster dans l’infrastructure AKS.

  • Des clusters sont des charges de travail de calcul individuelles, telles qu’Apache Spark, Apache Flink ou Trino, qui peuvent être créées dans le même pool de clusters.

Pour créer des clusters Apache Spark, Apache Flink ou Trino, vous devez d’abord créer un pool de clusters.

Prérequis

Vérifiez que vous remplissez les prérequis de l’abonnement et les prérequis des ressources avant de créer un pool de clusters.

Créer un pool de clusters

  1. Connectez-vous au portail Azure.

  2. Dans la barre de recherche du portail Azure, tapez « pool de clusters HDInsight sur AKS », puis sélectionnez « pools de clusters Azure HDInsight sur AKS » dans la liste déroulante.

    Diagramme montrant la barre de recherche dans le portail Azure.

  3. Cliquez sur + Créer.

    Diagramme montrant le bouton Créer.

  4. Sous l’onglet Informations de base, entrez les informations suivantes :

    Diagramme montrant l’onglet de base pour la création du pool de clusters.

    Propriété Description
    Abonnement Dans la liste déroulante, sélectionnez l’abonnement Azure sous lequel vous souhaitez créer le pool de clusters HDInsight sur AKS.
    Resource group Dans la liste déroulante, sélectionnez un groupe de ressources existant ou Créer.
    Nom du pool Entrez le nom du pool de clusters à créer. La longueur du nom du pool de clusters ne peut pas dépasser 26 caractères. Il doit commencer par un caractère alphabétique, se terminer par un caractère alphanumérique et doit contenir uniquement des caractères alphanumériques et des traits d’union.
    Région Dans la liste déroulante, sélectionnez la région du pool de clusters. Vérifier la disponibilité de la région. Pour les pools de clusters dans un réseau virtuel, la région du réseau virtuel et le pool de clusters doivent être identiques.
    Version du pool de clusters Dans la liste déroulante, sélectionnez la version du pool de clusters HDInsight sur AKS.
    Machine virtuelle Dans la liste déroulante, sélectionnez la taille de la machine virtuelle du pool de clusters en fonction de vos besoins.
    Groupe de ressources géré (Facultatif) Donner un nom au groupe de ressources managé. Il contient des ressources auxiliaires créées par HDInsight sur AKS.

    Sélectionnez Suivant : Sécurité + mise en réseau pour continuer.

  5. Sur la page Sécurité + mise en réseau, fournissez les informations suivantes :

    Diagramme montrant l’onglet réseau et sécurité pour la création du pool de clusters.

    Propriété Description
    Réseau virtuel (VNet) Dans la liste déroulante, sélectionnez un réseau virtuel qui se trouve dans la même région que le pool de clusters.
    Subnet Dans la liste déroulante, sélectionnez le nom du sous-réseau que vous envisagez d’associer au pool de clusters.

    Sélectionnez Suivant : Intégrations pour continuer.

  6. Sur la page Intégrations, fournissez les informations suivantes :

    Diagramme montrant l’onglet d’intégration pour la création du pool de clusters.

    Propriété Description
    Log Analytics (Facultatif) Sélectionner cette option pour permettre à Logs Analytics d’afficher des insights et des journaux directement dans votre cluster en envoyant des métriques et des journaux à un espace de travail Log Analytics.
    Azure Prometheus Vous pouvez activer cette option une fois la création du pool de clusters terminée.

    Sélectionnez Suivant : Étiquettes pour continuer.

  7. Sur la page Étiquettes, entrez les étiquettes (facultatif) que vous souhaitez attribuer au pool de clusters.

    Diagramme montrant les onglets pour la création du pool de clusters.

    Propriété Description
    Nom Entrez un nom (clé) qui vous aide à identifier les ressources en fonction des paramètres pertinents pour votre organisation. Par exemple, « Environnement » pour suivre l’environnement de déploiement de vos ressources.
    Valeur Entrez la valeur qui vous aide à établir une relation avec les ressources. Par exemple, « Production » pour identifier les ressources déployées en production.
    Ressource Sélectionnez le type de ressource applicable.

    Sélectionnez Suivant : Vérifier + créer pour continuer.

  8. Sur la page Vérifier + créer, recherchez le message Validation réussie en haut de la page, puis cliquez sur Créer.

    La page Le déploiement est en cours s’affiche pendant la création du pool de clusters, et la page Votre déploiement est terminé s’affiche une fois que le pool de clusters est entièrement déployé et prêt à être utilisé.

    Diagramme montrant l’onglet pour passer en revue et créer le pool de clusters.

    Si vous quittez la page, vous pouvez vérifier l’état du déploiement en cliquant sur l’icône Notifications.

    Conseil

    Pour résoudre les erreurs de déploiement, vous pouvez vous consulter cette page.

Une fois le déploiement du pool de clusters terminé, continuez à utiliser le portail Azure pour créer un cluster Trino, Flink et Spark.

Créer un cluster

Il existe trois manières de créer un cluster Azure HDInsight sur AKS à partir du portail Azure :

  • Recherchez et créez un « Cluster Azure HDInsight sur AKS» à partir du marketplace.
  • Recherchez et sélectionnez « Clusters Azure HDInsight sur AKS » dans le Portail Azure pour créer un cluster à partir de la page affichant tous les clusters HDInsight sur AKS.
  • Créez un cluster en sélectionnant Nouveau dans la page de Présentation d’un pool de clusters existant. Cette option vous offre deux façons de créer des clusters.
    • Créez un cluster en fournissant un nombre minimal d’entrées et en n’utilisant pas de configuration avancée. Cette option préremplit les champs de configuration requis avec des valeurs intelligentes par défaut et crée automatiquement des ressources obligatoires.

      La taille de la référence SKU de machine virtuelle est prérenseignée avec la référence SKU recommandée la moins coûteuse. En l’absence de référence SKU recommandée, elle est prérenseignée avec la référence SKU ayant le moins de vCores et le quota maximal disponible au moment de la création du cluster. Le cluster est créé avec un nombre constant par défaut de cinq nœuds. Les clusters Flink et Trino auront deux nœuds principaux, tandis que les clusters Spark en auront trois.

      L’identité managée et le compte de stockage affectés à l’utilisateur seront créés automatiquement dans le groupe de ressources managées. Vous pouvez passer en revue les configurations du cluster qui seraient créées dans l’onglet Évaluer+créer. Une fois que vous cliquez sur Créer, la page « Déploiement en cours » s’affiche pendant la création du cluster. Un message indiquant que « Votre déploiement est terminé » s’affiche une fois le cluster entièrement déployé et prêt à être utilisé.

      Diagramme montrant le mode de base de création d’un cluster.

    • Si vous souhaitez avoir plus de flexibilité pour personnaliser les configurations de cluster, activez l’option « Utiliser la configuration avancée ».

Important

Pour créer un cluster dans un nouveau pool de clusters, attribuez le rôle MSI « Opérateur d’identité managée » au pool d’agents AKS sur l’identité managée attribuée par l’utilisateur créée dans le cadre des prérequis des ressources. Lorsqu’un utilisateur a l’autorisation d’attribuer les rôles RBAC Azure, ils sont attribués automatiquement.

L’identité managée du pool d’agents AKS est créée lors de la création du pool de clusters. Vous pouvez identifier l’identité managée du pool d’agents AKS par (nom de votre pool de clusters)-agentpool. Effectuez ces étapes pour attribuer le rôle.

Pour obtenir un guide de démarrage rapide, reportez-vous aux étapes suivantes.

  1. Une fois la création du pool de clusters terminée, cliquez sur Accéder à la ressource à partir de la page Votre déploiement est terminé ou de la zone Notifications. Si l’option Accéder à la ressource n’est pas disponible, tapez Pool de clusters HDInsight sur AKS dans la barre de recherche du portail Azure, puis sélectionnez le pool de clusters que vous avez créé.

  2. Sélectionnez + Nouveau cluster, puis fournissez les informations suivantes :

    Capture d’écran montrant l’option de créer un nouveau cluster.

    Diagramme montrant comment créer un nouveau cluster.

    Propriété Description
    Abonnement Par défaut, il est rempli avec l’abonnement utilisé pour le pool de clusters.
    Resource group Par défaut, il est rempli avec le groupe de ressources utilisé pour le pool de clusters.
    Pool de clusters Représente le pool de clusters dans lequel le cluster doit être créé. Pour créer un cluster dans un autre pool, recherchez ce pool de clusters sur le portail, puis cliquez sur + Nouveau cluster.
    Région Par défaut, elle est remplie avec la région utilisée pour le pool de clusters.
    Version du pool de clusters Par défaut, elle est remplie avec la version utilisée pour le pool de clusters.
    Version de HDInsight sur AKS Dans la liste déroulante, sélectionnez la version de HDInsight sur AKS. Pour plus d’informations, consultez Contrôle de version.
    Type de cluster Dans la liste déroulante, sélectionnez le type de cluster que vous souhaitez créer : Trino, Flink ou Spark.
    Package de cluster Sélectionnez le package de cluster avec la version du composant disponible pour le type de cluster sélectionné.
    Nom du cluster Entrez le nom du nouveau cluster.
    Identité managée affectée par l’utilisateur Sélectionnez l’identité managée à utiliser avec le cluster.
    Compte de stockage (ADLS Gen2) Sélectionnez un compte de stockage et un conteneur qui deviendra l’emplacement par défaut des journaux de cluster et autres sorties. Il est obligatoire pour un type de cluster Apache Flink et Spark.
    Réseau virtuel (VNet) Réseau virtuel du cluster. Il est dérivé du pool de clusters.
    Subnet Sous-réseau du réseau virtuel du cluster. Il est dérivé du pool de clusters.

    Cliquez sur Suivant : Configuration pour continuer.

  3. Sur la page Configuration, fournissez les informations suivantes :

    Diagramme montrant l’onglet de configuration.

    Propriété Description
    Taille du nœud principal Cette valeur est identique à la taille du nœud Worker.
    Nombre de nœuds principaux Cette valeur est définie par défaut en fonction du type de cluster.
    Taille du nœud Worker Dans la liste déroulante, sélectionnez la référence SKU recommandée ou vous pouvez choisir la référence SKU disponible dans votre abonnement en cliquant sur Sélectionner la taille de machine virtuelle.
    Nombre de nœuds Worker Sélectionnez le nombre de nœuds Worker requis pour votre cluster.
    Mise à l’échelle automatique (Facultatif) Sélectionnez cette option pour activer la fonctionnalité de mise à l’échelle automatique
    Configuration Secure Shell (SSH) (Facultatif) Sélectionnez cette option pour activer le nœud SSH. En activant SSH, d’autres nœuds de machine virtuelle sont créés.

    Remarque

    Vous verrez une section supplémentaire pour fournir des configurations de service aux clusters Apache Flink.

    Cliquez sur Suivant : Intégrations pour continuer.

  4. Sur la page Intégrations, fournissez les informations suivantes :

    Diagramme montrant l’onglet d’intégration.

    Propriété Description
    Log Analytics (Facultatif) Sélectionner cette option pour permettre à Logs Analytics d’afficher des insights et des journaux directement dans votre cluster en envoyant des métriques et des journaux à un espace de travail Log Analytics.
    Azure Prometheus (Facultatif) Sélectionner cette option pour permettre à Azure Managed Prometheus d’afficher des insights et des journaux directement dans votre cluster en envoyant des métriques et des journaux à un espace de travail Azure Monitor.

    Remarque

    Pour activer Log Analytics et Azure Prometheus, ils doivent d’abord être activés au niveau du pool de clusters.

    Sélectionnez Suivant : Étiquettes pour continuer.

  5. Sur la page Étiquettes, entrez les étiquettes (facultatif) que vous souhaitez attribuer au cluster.

    Capture d’écran montrant la page des balises.

    Propriété Description
    Nom Entrez un nom (clé) qui vous aide à identifier les ressources en fonction des paramètres pertinents pour votre organisation. « Environnement » pour suivre l’environnement de déploiement de vos ressources.
    Valeur Entrez la valeur qui vous aide à établir une relation avec les ressources. « Production » pour identifier les ressources déployées en production.
    Ressource Sélectionnez le type de ressource applicable.

    Sélectionnez Suivant : Vérifier + créer pour continuer.

  6. Sur la page Vérifier + créer, recherchez le message Validation réussie en haut de la page, puis cliquez sur Créer.

    Diagramme montrant l’onglet d’évaluation et de création du cluster.

    La page Le déploiement est en cours s’affiche pendant la création du cluster, et la page « Votre déploiement est terminé » s’affiche une fois que le cluster est entièrement déployé et prêt à être utilisé.

    Conseil

    Pour résoudre les problèmes liés à des erreurs de déploiement, vous pouvez consulter cette page.