Partager via


Qu’est-ce que HDInsight sur AKS ? (Préversion)

Remarque

Nous allons mettre hors service Azure HDInsight sur AKS le 31 janvier 2025. Avant le 31 janvier 2025, vous devrez migrer vos charges de travail vers Microsoft Fabric ou un produit Azure équivalent afin d’éviter leur arrêt brutal. Les clusters restants de votre abonnement seront arrêtés et supprimés de l’hôte.

Seul le support de base sera disponible jusqu’à la date de mise hors service.

Important

Cette fonctionnalité est disponible actuellement en mode Aperçu. Les Conditions d’utilisation supplémentaires pour les préversions de Microsoft Azure contiennent davantage de conditions légales qui s’appliquent aux fonctionnalités Azure en version bêta, en préversion ou ne se trouvant pas encore en disponibilité générale. Pour plus d’informations sur cette préversion spécifique, consultez les Informations sur la préversion d’Azure HDInsight sur AKS. Pour toute question ou pour des suggestions à propos des fonctionnalités, veuillez envoyer vos requêtes et leurs détails sur AskHDInsight, et suivez-nous sur la Communauté Azure HDInsight pour plus de mises à jour.

HDInsight sur AKS est une plateforme en tant que service (PaaS) moderne, fiable, sécurisée et entièrement gérée qui s'exécute sur Azure Kubernetes Service (AKS). HDInsight sur AKS vous permet de déployer des charges de travail Open-Source Analytics populaires telles que Apache Spark™, Apache Flink®️ et Trino sans les frais généraux liés à la gestion et à la surveillance des conteneurs.

Vous pouvez créer des applications Big Data de bout en bout, à l'échelle du pétaoctet, couvrant le streaming via Apache Flink, l'engineering données et l'apprentissage automatique à l'aide d'Apache Spark et le puissant moteur de requêtes de Trino.

Toutes ces capacités, combinées à HDInsight et à la forte orientation développeur d'AKS, permettent aux entreprises et aux natifs du numérique dotés d'une expertise technique approfondie de créer et d'exploiter des applications parfaitement adaptées à leurs besoins. HDInsight sur AKS permet aux développeurs d'accéder à toutes les configurations riches fournies par les logiciels open source et à l'extensibilité nécessaire pour inclure de manière transparente d'autres offres de l'écosystème. Cette offre permet aux développeurs de tester et d'ajuster leurs applications pour en extraire les meilleures performances à un coût optimal.

HDInsight sur AKS s'intègre à l'ensemble de l'écosystème Azure, raccourcissant les cycles de mise en œuvre et améliorant le délai de réalisation de la valeur.

Diagramme montrant les avantages de HDInsight sur AKS.

Architecture technique

HDInsight sur AKS introduit le concept de pools de clusters et de clusters, qui vous permettent de tirer pleinement parti de la valeur de Data Lakehouse. Les pools de clusters vous permettent d'utiliser plusieurs charges de travail de calcul sur un seul lac de données, supprimant ainsi les frais de gestion du réseau et de planification des ressources.

  • Les pools de clusters sont un regroupement logique de clusters qui contribuent à créer une interopérabilité robuste entre plusieurs types de clusters et permettent aux entreprises de disposer des clusters dans le même réseau virtuel. Les pools de clusters offrent un accès rapide et rentable à tous les types de clusters créés à la demande et à grande échelle. Un pool de clusters correspond à un cluster dans l'infrastructure AKS.
  • Les clusters sont des charges de travail de calcul individuelles, telles qu’Apache Spark, Apache Flink et Trino, qui peuvent être créées rapidement en quelques minutes avec des configurations prédéfinies.

Vous pouvez créer le pool avec un seul cluster ou une combinaison de types de cluster, en fonction des besoins et configurer de manière personnalisée les options suivantes :

  • Stockage
  • Réseau
  • Journalisation
  • Surveillance

Le diagramme suivant montre l'architecture technique logique des composants installés dans un pool de clusters par défaut. Les clusters sont isolés à l'aide d'espaces de noms dans les clusters AKS.

Diagramme montrant l’architecture de HDInsight sur AKS.

Plateforme de calcul cloud native modernisée

La dernière version de HDInsight est orchestrée à l'aide d'AKS, ce qui permet à la plateforme d'être plus robuste et permet aux utilisateurs de gérer efficacement les clusters. Le provisionnement des clusters sur HDInsight sur AKS est rapide et fiable, ce qui facilite la gestion des clusters et la réalisation de mises à niveau sur place. Avec un vaste choix de SKU et des modèles d'abonnement flexibles, la modernisation des lacs de données à l'aide d'une infrastructure open source, cloud native et évolutive sur HDInsight sur AKS peut répondre à tous vos besoins d'analyse.

Diagramme montrant la façon dont HDInsight sur AKS a été modernisé avec la plateforme de calcul native sur le cloud.

Les principales fonctionnalités incluent :

  • Création et mise à l'échelle rapides de clusters.
  • Facilité de maintenance et mises à jour de sécurité périodiques.
  • Résilience de cluster optimisée par AKS cloud natif moderne.
  • Prise en charge native de l'authentification moderne avec OAuth et Microsoft Entra ID.
  • Intégration approfondie avec Azure Services – Azure Data Factory (ADF), Power BI, Azure Monitor.

Connectivité à HDInsight

HDInsight sur AKS peut se connecter de manière transparente à HDInsight. Vous pouvez profiter des avantages de l’utilisation des types de cluster nécessaires dans un modèle hybride. Interagissez avec les types de clusters de HDInsight en utilisant le même stockage et le même métastore dans les deux offres.

HDInsight offre Apache Kafka®, Apache HBase® et d’autres charges de travail d’analytique dans un facteur de forme PaaS (Platform as a Service).

Diagramme montrant les concepts de connectivité.

Les scénarios suivants sont pris en charge :

l’architecture de sécurité,

HDInsight sur AKS est sécurisé par défaut. Il permet aux entreprises de protéger leurs données d'entreprise avec le réseau virtuel Azure, le chiffrement et l'intégration avec Microsoft Entra ID. Il répond également aux normes de conformité les plus populaires du secteur et du gouvernement, respectant les normes Azure. Avec plus de 30 certifications qui aident à protéger les données, ainsi que des mises à jour périodiques, des notifications de conseiller en santé, des analyses de l'état des services, ainsi que les meilleures normes de sécurité Azure de leur catégorie. HDInsight sur AKS propose plusieurs méthodes pour répondre par défaut aux besoins de sécurité de votre entreprise. Pour plus d'informations, consultez HDInsight sur la sécurité AKS.

Diagramme montrant le concept de sécurité.

Disponibilité régionale (préversion publique)

Asie-Pacifique

  • Australie Est
  • Inde centrale
  • Asie Est
  • Japon Est
  • Centre de la Corée
  • Asie Sud-Est

Europe

  • France Centre
  • Europe Nord
  • Norvège Est
  • Suisse Nord
  • Sud du Royaume-Uni
  • Europe Ouest

Amérique

  • Brésil Sud
  • Centre du Canada
  • USA Centre
  • USA Est
  • USA Est 2
  • USA Est 2 (EUAP)
  • États-Unis - partie centrale méridionale
  • USA Ouest
  • USA Ouest 2
  • USA Ouest 3

Remarque

  • La marque Trino et les marques commerciales sont détenues et gérées par Trino Software Foundation. L’utilisation de ces marques n’implique aucune approbation de Trino Software Foundation.
  • Apache Spark, Spark et le logo Spark sont des marques commerciales d’Apache Software Foundation (ASF).
  • Apache, Apache Kafka, Kafka et le logo Kafka sont des marques commerciales d’Apache Software Foundation (ASF).
  • Apache, Apache Flink, Flink et le logo Flink sont des marques commerciales d’Apache Software Foundation (ASF).
  • Apache HBase, HBase et le logo HBase sont des marques commerciales d’Apache Software Foundation (ASF).
  • Apache®, Apache Spark™, Apache HBase®, Apache Kafka® et Apache Flink® sont des marques déposées ou des marques commerciales d’Apache Software Foundation aux États-Unis et/ou dans d’autres pays. L’utilisation de ces marques n’implique aucune approbation de l’Apache Software Foundation.