Condividi tramite


Che cos'è Trino? (anteprima)

Importante

Questa funzionalità è attualmente disponibile solo in anteprima. Le condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure disponibili in versione beta, in anteprima o non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire microsoft per altri aggiornamenti nella community di Azure HDInsight.

Trino (in precedenza PrestoSQL) è un motore di query SQL distribuito open source per l'analisi federata e interattiva su origini dati eterogenee. Può eseguire query sui dati su larga scala (gigabyte a petabyte) da più origini per abilitare l'analisi a livello aziendale.

Trino viene usato per un'ampia gamma di casi d'uso analitici ed è un'ottima scelta per l'esecuzione di query interattive e ad hoc.

Alcune delle principali funzionalità offerte da Trino -

  • Un sistema multi-tenant adattivo in grado di eseguire simultaneamente centinaia di query di memoria, I/O e con utilizzo intensivo della CPU e scalabilità in migliaia di nodi di lavoro usando in modo efficiente le risorse del cluster.
  • Progettazione estendibile e federata per ridurre la complessità dell'integrazione di più sistemi.
  • Prestazioni elevate, con diverse funzionalità e ottimizzazioni correlate chiave.
  • Completamente compatibile con l'ecosistema Hadoop.

Esistono due tipi di server Trino: coordinatori e lavoratori.

Coordinatore

Il coordinatore Trino è il server responsabile dell'analisi delle istruzioni, della pianificazione delle query e della gestione dei nodi di lavoro Trino. È il "cervello" di un'installazione di Trino ed è anche il nodo a cui un client si connette per inviare istruzioni per l'esecuzione. Il coordinatore tiene traccia dell'attività in ogni ruolo di lavoro e coordina l'esecuzione di una query. Il coordinatore crea un modello logico di una query, che prevede una serie di fasi, che viene tradotta in una serie di attività connesse eseguite in un cluster di ruoli di lavoro Trino.

Lavoro

Un ruolo di lavoro Trino è un server in un'installazione di Trino, responsabile dell'esecuzione di attività ed elaborazione dei dati. I nodi di lavoro recuperano i dati dai connettori e scambiano dati intermedi tra loro. Il coordinatore è responsabile del recupero dei risultati dai lavoratori e della restituzione dei risultati finali al cliente.

Diagramma che mostra l'architettura trino.