Installer des applications Apache Hadoop tierces sur Azure HDInsight

Découvrez comment installer une application Apache Hadoop tierce sur Azure HDInsight. Pour des instructions d’installation de votre propre application, consultez la page Installer des applications HDInsight personnalisées.

Une application HDInsight est une application que les utilisateurs peuvent installer sur un cluster HDInsight. Ces applications peuvent être développées par Microsoft, par des éditeurs de logiciels indépendants (ISV) ou par vous-même.

La liste suivante affiche les applications publiées :

Application Type(s) de cluster(s) Description
AtScale Intelligence Platform Hadoop AtScale transforme votre cluster HDInsight en serveur OLAP scale-out, qui vous permet d’interroger des milliards de lignes de données de manière interactive à l’aide des outils décisionnels que vous connaissez et utilisez déjà, tels que Microsoft Excel, Power BI, Tableau Software et QlikView.
Datameer Hadoop La plateforme évolutive en libre-service de Datameer pour la préparation, l’exploration et la gouvernance des données à des fins d’analytique accélère la transformation des données complexes issues de plusieurs sources en informations utiles prêtes à l’emploi. Vous bénéficiez ainsi d’insights plus rapides et pertinents à l’échelle de l’entreprise.
Dataiku DSS on HDInsight Hadoop, Spark Dataiku DSS est une plateforme de science des données d’entreprise qui permet aux scientifiques des données et aux analyses de données de collaborer plus efficacement sur la conception et l’exécution de nouveaux produits et services de données, convertissant ainsi les données brutes en prédictions percutantes.
WANdisco Fusion HDI App Hadoop, Spark, HBase, Kafka Parvenir à garantir la cohérence des données dans un environnement distribué représente un véritable défi au niveau des opérations de données volumineuses. WANdisco Fusion, une plateforme logicielle d’entreprise, résout ce problème en assurant la cohérence des données non structurées au sein de n’importe quel environnement.
H2O SparklingWater for HDInsight Spark H2O Sparkling Water prend en charge les algorithmes distribués suivants : GLM, Naïve Bayes, Distributed Random Forest, Gradient Boosting Machine, Deep Neural Networks, Deep learning, K-means, PCA, Generalized Low Rank Models, Anomaly Detection, Autoencoders.
Striim for Real-Time Data Integration to HDInsight Hadoop, HBase, Spark, Kafka Striim (prononcé « stream ») est une plateforme de bout en bout d’intégration et d’intelligence qui permet l’ingestion, le traitement et l’analyse en continu de flux de données disparates.
Jumbune Enterprise-Accelerating BigData Analytics Hadoop, Spark Globalement, Jumbune aide les entreprises en : 1. accélérant les performances de charge de travail Hive, Java, Scala basées sur le moteur Tez, MapReduce et Spark ; 2. offrant une surveillance proactive des clusters Hadoop ; 3. mettant en place une gestion de la qualité des données sur le système de fichiers DFS.
Kyligence Enterprise Hadoop, HBase, Spark Avec Apache Kylin, Kyligence Enterprise applique le décisionnel au Big Data. En tant que moteur OLAP d’entreprise sur Hadoop, Kyligence Enterprise permet aux analystes métier de concevoir l’architecture du décisionnel sur Hadoop avec des méthodologies de décisionnel et d’entrepôt de données standard.
StreamSets Data Collector for HDInsight Cloud Hadoop, HBase, Spark, Kafka StreamSets Data Collector est un puissant moteur léger qui diffuse les données en temps réel. Utilisez Data Collector pour acheminer et traiter les données dans vos flux de données. Cette application est fournie avec une licence d’essai de 30 jours.
Trifacta Wrangler Enterprise Hadoop, Spark, HBase Trifacta Wrangler Enterprise pour HDInsight prend en charge le data wrangling dans l’ensemble de l’entreprise pour n’importe quelle échelle de données. Le coût d’exécution de Trifacta sur Azure combine les coûts d’abonnement Trifacta et les coûts d’infrastructure Azure pour les machines virtuelles.
Unifi Data Platform Hadoop, HBase, Spark Unifi Data Platform est une suite intégrée d’outils de données en libre-service conçus pour permettre aux utilisateurs professionnels de faire face aux défis liés aux données pour générer plus de revenus, et réduire les coûts ou la complexité opérationnelle.

Les instructions fournies dans cet article utilisent le portail Azure. Vous pouvez également exporter le modèle Azure Resource Manager à partir du portail ou obtenir une copie de ce modèle auprès des fournisseurs et utiliser Azure PowerShell et Azure Classic CLI pour déployer le modèle. Consultez Créer des clusters Apache Hadoop dans HDInsight avec des modèles Resource Manager.

Prérequis

Pour installer des applications HDInsight sur un cluster HDInsight existant, vous devez disposer d’un cluster HDInsight. Pour en créer un, consultez Créer des clusters. Vous pouvez également installer des applications HDInsight lorsque vous créez un cluster HDInsight.

Installer des applications dans des clusters existants

La procédure suivante montre comment installer des applications HDInsight dans un cluster HDInsight existant.

Installer une application HDInsight

  1. Connectez-vous au portail Azure.

  2. Dans le menu de gauche, accédez à Tous les services>Analytique>Clusters HDInsight.

  3. Sélectionnez un cluster HDInsight dans la liste. Si vous ne disposez pas d’un tel cluster, vous devez d’abord en créer un. Consultez la page Créer des clusters.

  4. Sous la catégorie Paramètres, sélectionnez Applications. Vous pouvez consulter la liste des applications installées dans la fenêtre principale.

    HDInsight applications portal menu.

  5. Dans le menu, sélectionnez +Ajouter. La liste des applications disponibles s’affiche. Si l’option +Ajouter est grisée, cela signifie qu’il n’existe aucune application pour cette version du cluster HDInsight.

    HDInsight applications available applications.

  6. Sélectionnez l’une des applications disponibles, puis suivez les instructions pour accepter les conditions légales.

Vous pouvez vérifier l’état de l’installation de l’application dans les notifications du portail (sélectionnez l’icône en forme de cloche en haut du portail). L’application installée apparaît dans la liste Applications installées.

Installer des applications lors de la création du cluster

Vous pouvez également installer des applications HDInsight lorsque vous créez un cluster. Au cours du processus, les applications HDInsight sont installées une fois le cluster créé et en cours d’exécution. Pour installer des applications pendant la création du cluster à l’aide du portail Azure, à partir de l’onglet Configuration + prix, sélectionnez + Ajouter une application.

Azure portal cluster configuration applications.

Répertorier les applications HDInsight installées et les propriétés

Le portail affiche une liste des applications HDInsight installées pour un cluster et les propriétés de chaque application installée.

Répertorier une application HDInsight et afficher des propriétés

  1. Connectez-vous au portail Azure.

  2. Dans le menu de gauche, accédez à Tous les services>Analytique>Clusters HDInsight.

  3. Sélectionnez un cluster HDInsight dans la liste.

  4. Sous la catégorie Paramètres, sélectionnez Applications. Vous pouvez consulter la liste des applications installées dans la fenêtre principale.

    HDInsight applications installed apps.

  5. Sélectionnez l’une des applications installées pour en afficher la propriété. Listes des propriétés :

    Propriété Description
    Nom de l’application Nom de l’application.
    Statut État de l’application.
    Page web L’URL de l’application web que vous avez déployée sur le nœud de périphérie. Les informations d’identification sont les mêmes que celles de l’utilisateur HTTP configurées pour le cluster.
    Point de terminaison SSH Vous pouvez utiliser SSH pour vous connecter au nœud de périphérie. Les informations d’identification sont les mêmes que celles de l’utilisateur SSH configurées pour le cluster. Pour plus d’informations, consultez Utiliser SSH avec HDInsight.
    Description Description de l’application.
  6. Pour supprimer une application, cliquez avec le bouton droit sur l’application, puis sur Supprimer dans le menu contextuel.

Connexion au nœud de périmètre

Vous pouvez vous connecter au nœud de périmètre à l’aide de HTTP et SSH. Vous trouverez les informations de point de terminaison sur le portail. Pour plus d’informations, consultez Utiliser SSH avec HDInsight.

Les informations d’identification du point de terminaison HTTP sont les informations d’identification de l’utilisateur HTTP configurées pour le cluster HDInsight. Les informations d’identification du point de terminaison SSH sont les informations d’identification SSH configurées pour le cluster HDInsight.

Résolution des problèmes

Consultez Dépanner l’installation.

Étapes suivantes