Co je Trino? (Preview)

Důležité

Tato funkce je aktuálně dostupná jako ukázková verze. Doplňkové podmínky použití pro Microsoft Azure Preview obsahují další právní podmínky, které se vztahují na funkce Azure, které jsou v beta verzi, ve verzi Preview nebo ještě nejsou vydány v obecné dostupnosti. Informace o této konkrétní verzi Preview najdete v tématu Azure HDInsight o službě AKS ve verzi Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost na AskHDInsight s podrobnostmi a sledujte nás o dalších aktualizacích v komunitě Azure HDInsight.

Trino (dříve PrestoSQL) je opensourcový distribuovaný dotazovací modul SQL pro federované a interaktivní analýzy pro heterogenní zdroje dat. Může dotazovat data ve velkém měřítku (gigabajty až petabajty) z více zdrojů, aby bylo možné provádět analýzy na podnikové úrovni.

Trino se používá pro širokou škálu případů analytického použití a je skvělou volbou pro interaktivní a ad hoc dotazování.

Některé z klíčových funkcí, které Trino nabízí -

  • Adaptivní systém s více tenanty schopný souběžně spouštět stovky dotazů náročných na paměť, vstupně-výstupní operace a procesor a škálování na tisíce pracovních uzlů a efektivně využívat prostředky clusteru.
  • Rozšiřitelný a federovaný návrh, aby se snížila složitost integrace více systémů.
  • Vysoký výkon s několika klíčovými souvisejícími funkcemi a optimalizacemi.
  • Plně kompatibilní s ekosystémem Hadoop.

Existují dva typy serverů Trino: koordinátory a pracovní procesy.

Koordinátor

Koordinátor Trino je server, který zodpovídá za parsování příkazů, plánování dotazů a správu pracovních uzlů Trino. Jedná se o "mozek" instalace Trino a je také uzlem, ke kterému se klient připojuje k odesílání příkazů ke spuštění. Koordinátor sleduje aktivitu jednotlivých pracovních procesů a koordinuje provádění dotazu. Koordinátor vytvoří logický model dotazu, který zahrnuje řadu fází, které se přeloží na řadu propojených úloh spuštěných v clusteru pracovních procesů Trino.

Pracovní podproces

Pracovní proces Trino je server v instalaci Trino, který zodpovídá za provádění úloh a zpracování dat. Pracovní uzly načítají data z konektorů a vzájemně si vyměňují zprostředkující data. Koordinátor zodpovídá za načtení výsledků od pracovníků a vrácení konečných výsledků klientovi.

Diagram znázorňující architekturu Trino