Qual é Trino? (Pré-visualização)
Nota
Vamos desativar o Azure HDInsight no AKS em 31 de janeiro de 2025. Antes de 31 de janeiro de 2025, você precisará migrar suas cargas de trabalho para o Microsoft Fabric ou um produto equivalente do Azure para evitar o encerramento abrupto de suas cargas de trabalho. Os clusters restantes na sua subscrição serão interrompidos e removidos do anfitrião.
Apenas o apoio básico estará disponível até à data da reforma.
Importante
Esta funcionalidade está atualmente em pré-visualização. Os Termos de Utilização Suplementares para Pré-visualizações do Microsoft Azure incluem mais termos legais que se aplicam a funcionalidades do Azure que estão em versão beta, em pré-visualização ou ainda não disponibilizadas para disponibilidade geral. Para obter informações sobre essa visualização específica, consulte Informações de visualização do Azure HDInsight no AKS. Para perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para obter mais atualizações na Comunidade do Azure HDInsight.
Trino (anteriormente PrestoSQL) é um mecanismo de consulta SQL distribuído de código aberto para análises federadas e interativas contra fontes de dados heterogêneas. Ele pode consultar dados em escala (gigabytes a petabytes) de várias fontes para permitir análises em toda a empresa.
Trino é usado para uma ampla gama de casos de uso analíticos e é uma excelente escolha para consultas interativas e ad-hoc.
Algumas das principais características que Trino oferece -
- Um sistema multilocatário adaptável capaz de executar simultaneamente centenas de consultas intensivas de memória, E/S e CPU, e dimensionar para milhares de nós de trabalho enquanto utiliza recursos de cluster de forma eficiente.
- Design extensível e federado para reduzir a complexidade da integração de vários sistemas.
- Alto desempenho, com várias funcionalidades e otimizações relacionadas.
- Totalmente compatível com o ecossistema Hadoop.
Existem dois tipos de servidores Trino: coordenadores e trabalhadores.
Coordenador
O coordenador Trino é o servidor responsável por analisar instruções, planejar consultas e gerenciar nós de trabalho Trino. É o "cérebro" de uma instalação Trino e também é o nó ao qual um cliente se conecta para enviar instruções para execução. O coordenador controla a atividade em cada trabalhador e coordena a execução de uma consulta. O coordenador cria um modelo lógico de uma consulta, que envolve uma série de etapas, que é traduzido em uma série de tarefas conectadas executadas em um cluster de trabalhadores Trino.
Trabalhador
Um trabalhador Trino é um servidor em uma instalação Trino, que é responsável pela execução de tarefas e processamento de dados. Os nós de trabalho buscam dados de conectores e trocam dados intermediários entre si. O coordenador é responsável por buscar os resultados dos trabalhadores e devolver os resultados finais ao cliente.