Vad är Trino? (Förhandsversion)

Viktigt!

Den här funktionen finns i förhandsgranskning. De kompletterande användningsvillkoren för Förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. Om du vill ha frågor eller funktionsförslag skickar du en begäran på AskHDInsight med informationen och följer oss för fler uppdateringar i Azure HDInsight Community.

Trino (tidigare PrestoSQL) är en distribuerad SQL-frågemotor med öppen källkod för federerad och interaktiv analys mot heterogena datakällor. Den kan köra frågor mot data i stor skala (gigabyte till petabyte) från flera källor för att aktivera företagsomfattande analys.

Trino används för en mängd olika analytiska användningsfall och är ett utmärkt val för interaktiv och ad hoc-frågor.

Några av de viktigaste funktionerna som Trino erbjuder -

  • Ett anpassningsbart system med flera klientorganisationer som kan köra hundratals minnes-, I/O- och CPU-intensiva frågor samtidigt och skala till tusentals arbetsnoder samtidigt som klusterresurser används effektivt.
  • Utökningsbar och federerad design för att minska komplexiteten i integreringen av flera system.
  • Höga prestanda, med flera viktiga relaterade funktioner och optimeringar.
  • Fullständigt kompatibel med Hadoop-ekosystemet.

Det finns två typer av Trino-servrar: koordinatorer och arbetare.

Koordinator

Trino-koordinatorn är den server som ansvarar för att parsa instruktioner, planera frågor och hantera Trino-arbetsnoder. Det är "hjärnan" i en Trino-installation och är också den nod som en klient ansluter till för att skicka instruktioner för körning. Koordinatorn håller reda på aktiviteten på varje arbetare och samordnar körningen av en fråga. Koordinatorn skapar en logisk modell av en fråga, som omfattar en serie faser, som översätts till en serie anslutna uppgifter som körs i ett kluster med Trino-arbetare.

Arbetare

En Trino-arbetare är en server i en Trino-installation som ansvarar för att utföra uppgifter och bearbeta data. Arbetsnoder hämtar data från anslutningsappar och utbyter mellanliggande data med varandra. Koordinatorn ansvarar för att hämta resultat från arbetarna och returnera de slutliga resultaten till klienten.

Diagram som visar Trino-arkitektur.