Co je Trino? (Preview)
Důležité
Tato funkce je aktuálně dostupná jako ukázková verze. Doplňkové podmínky použití pro Microsoft Azure Preview obsahují další právní podmínky, které se vztahují na funkce Azure, které jsou v beta verzi, ve verzi Preview nebo ještě nejsou vydány v obecné dostupnosti. Informace o této konkrétní verzi Preview najdete v tématu Azure HDInsight o službě AKS ve verzi Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost na AskHDInsight s podrobnostmi a sledujte nás o dalších aktualizacích v komunitě Azure HDInsight.
Trino (dříve PrestoSQL) je opensourcový distribuovaný dotazovací modul SQL pro federované a interaktivní analýzy pro heterogenní zdroje dat. Může dotazovat data ve velkém měřítku (gigabajty až petabajty) z více zdrojů, aby bylo možné provádět analýzy na podnikové úrovni.
Trino se používá pro širokou škálu případů analytického použití a je skvělou volbou pro interaktivní a ad hoc dotazování.
Některé z klíčových funkcí, které Trino nabízí -
- Adaptivní systém s více tenanty schopný souběžně spouštět stovky dotazů náročných na paměť, vstupně-výstupní operace a procesor a škálování na tisíce pracovních uzlů a efektivně využívat prostředky clusteru.
- Rozšiřitelný a federovaný návrh, aby se snížila složitost integrace více systémů.
- Vysoký výkon s několika klíčovými souvisejícími funkcemi a optimalizacemi.
- Plně kompatibilní s ekosystémem Hadoop.
Existují dva typy serverů Trino: koordinátory a pracovní procesy.
Koordinátor
Koordinátor Trino je server, který zodpovídá za parsování příkazů, plánování dotazů a správu pracovních uzlů Trino. Jedná se o "mozek" instalace Trino a je také uzlem, ke kterému se klient připojuje k odesílání příkazů ke spuštění. Koordinátor sleduje aktivitu jednotlivých pracovních procesů a koordinuje provádění dotazu. Koordinátor vytvoří logický model dotazu, který zahrnuje řadu fází, které se přeloží na řadu propojených úloh spuštěných v clusteru pracovních procesů Trino.
Pracovní podproces
Pracovní proces Trino je server v instalaci Trino, který zodpovídá za provádění úloh a zpracování dat. Pracovní uzly načítají data z konektorů a vzájemně si vyměňují zprostředkující data. Koordinátor zodpovídá za načtení výsledků od pracovníků a vrácení konečných výsledků klientovi.