Partager via


Qu’est-ce que Trino ? (Préversion)

Remarque

Nous allons mettre hors service Azure HDInsight sur AKS le 31 janvier 2025. Avant le 31 janvier 2025, vous devrez migrer vos charges de travail vers Microsoft Fabric ou un produit Azure équivalent afin d’éviter leur arrêt brutal. Les clusters restants de votre abonnement seront arrêtés et supprimés de l’hôte.

Seul le support de base sera disponible jusqu’à la date de mise hors service.

Important

Cette fonctionnalité est disponible actuellement en mode Aperçu. Les Conditions d’utilisation supplémentaires pour les préversions de Microsoft Azure contiennent davantage de conditions légales qui s’appliquent aux fonctionnalités Azure en version bêta, en préversion ou ne se trouvant pas encore en disponibilité générale. Pour plus d’informations sur cette préversion spécifique, consultez les Informations sur la préversion d’Azure HDInsight sur AKS. Pour toute question ou pour des suggestions à propos des fonctionnalités, veuillez envoyer vos requêtes et leurs détails sur AskHDInsight, et suivez-nous sur la Communauté Azure HDInsight pour plus de mises à jour.

Trino (anciennement PrestoSQL) est un moteur de requête SQL distribué open source pour l’analyse fédérée et interactive sur des sources de données hétérogènes. Il peut interroger des données à grande échelle (gigaoctets à pétaoctets) à partir de plusieurs sources pour permettre l’analyse à l’échelle d’une entreprise.

Trino est utilisé pour un large éventail de cas d’usage analytiques et constitue un excellent choix pour l’interrogation interactive et ad hoc.

Certaines des principales fonctionnalités proposées par Trino :

  • Un système multilocataire adaptatif capable d’exécuter simultanément des centaines de requêtes nécessitant beaucoup de mémoire, d’E/S et d’UC, et de mise à l’échelle vers des milliers de nœuds Worker tout en utilisant efficacement les ressources de cluster.
  • Une conception extensible et fédérée pour réduire la complexité de l’intégration de plusieurs systèmes.
  • De hautes performances, avec plusieurs fonctionnalités et optimisations clés associées.
  • Compatibilité complète avec l’écosystème Hadoop.

Il existe deux types de serveurs Trino : les coordinateurs et les Workers.

Coordinatrice

Le coordinateur Trino est le serveur responsable de l’analyse des instructions, de la planification des requêtes et de la gestion des nœuds Worker Trino. Il s’agit du « cerveau » d’une installation Trino et est également le nœud auquel un client se connecte pour envoyer des instructions pour l’exécution. Le coordinateur effectue le suivi de l’activité sur chaque Worker et coordonne l’exécution d’une requête. Le coordinateur crée un modèle logique d’une requête, qui implique une série d’étapes, traduit en une série de tâches connectées exécutées sur un cluster de Workers Trino.

Worker

Un Worker Trino est un serveur dans une installation Trino qui est responsable de l’exécution des tâches et du traitement des données. Les nœuds Worker récupèrent des données à partir de connecteurs et échangent des données intermédiaires entre eux. Le coordinateur est chargé de récupérer les résultats des Workers et de retourner les résultats finaux au client.

Diagramme montrant l’architecture de Trino.