Udostępnij za pośrednictwem


Co to jest Trino? (wersja zapoznawcza)

Ważne

Ta funkcja jest aktualnie dostępna jako funkcja podglądu. Dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure obejmują więcej warunków prawnych, które dotyczą funkcji platformy Azure, które znajdują się w wersji beta, w wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej. Aby uzyskać informacje o tej konkretnej wersji zapoznawczej, zobacz Informacje o wersji zapoznawczej usługi Azure HDInsight w usłudze AKS. W przypadku pytań lub sugestii dotyczących funkcji prześlij żądanie w usłudze AskHDInsight , aby uzyskać szczegółowe informacje i postępuj zgodnie z nami, aby uzyskać więcej aktualizacji w społeczności usługi Azure HDInsight.

Trino (dawniej PrestoSQL) to rozproszony aparat zapytań SQL typu open source do federacyjnej i interaktywnej analizy dla heterogenicznych źródeł danych. Umożliwia wykonywanie zapytań dotyczących danych na dużą skalę (gigabajtów do petabajtów) z wielu źródeł w celu umożliwienia analizy w całym przedsiębiorstwie.

Trino jest używany do szerokiej gamy analitycznych przypadków użycia i jest doskonałym wyborem do interakcyjnych i ad hoc zapytań.

Niektóre z kluczowych funkcji oferowanych przez Trino —

  • Adaptacyjny system wielodostępny zdolny do jednoczesnego uruchamiania setek pamięci, operacji we/wy i zapytań intensywnie korzystających z procesora CPU oraz skalowania do tysięcy węzłów roboczych przy jednoczesnym wydajnym wykorzystaniu zasobów klastra.
  • Rozszerzalny i federacyjny projekt, aby zmniejszyć złożoność integrowania wielu systemów.
  • Wysoka wydajność z kilkoma kluczowymi funkcjami i optymalizacjami.
  • W pełni zgodne z ekosystemem usługi Hadoop.

Istnieją dwa typy serwerów Trino: koordynatorzy i pracownicy.

Koordynator

Koordynator Trino jest serwerem odpowiedzialnym za analizowanie instrukcji, planowanie zapytań i zarządzanie węzłami procesu roboczego Trino. Jest to "mózg" instalacji Trino, a także węzeł, z którym klient łączy się z przesyłaniem instrukcji do wykonania. Koordynator śledzi działanie każdego procesu roboczego i koordynuje wykonywanie zapytania. Koordynator tworzy logiczny model zapytania, który obejmuje szereg etapów, które są tłumaczone na serię połączonych zadań uruchamianych w klastrze procesów roboczych Trino.

Pracownik

Proces roboczy Trino to serwer w instalacji Trino, który jest odpowiedzialny za wykonywanie zadań i przetwarzanie danych. Węzły robocze pobierają dane z łączników i wymieniają ze sobą dane pośrednie. Koordynator jest odpowiedzialny za pobieranie wyników od pracowników i zwracanie końcowych wyników do klienta.

Diagram przedstawiający architekturę Trino.