Freigeben über


Was ist Trino? (Vorschau)

Hinweis

Azure HDInsight on AKS wird am 31. Januar 2025 eingestellt. Vor dem 31. Januar 2025 müssen Sie Ihre Workloads zu Microsoft Fabric oder einem gleichwertigen Azure-Produkt migrieren, um eine abruptes Beendigung Ihrer Workloads zu vermeiden. Die verbleibenden Cluster in Ihrem Abonnement werden beendet und vom Host entfernt.

Bis zum Einstellungsdatum ist nur grundlegende Unterstützung verfügbar.

Wichtig

Diese Funktion steht derzeit als Vorschau zur Verfügung. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure-Vorschauen enthalten weitere rechtliche Bestimmungen, die für Azure-Features in Betaversionen, in Vorschauversionen oder anderen Versionen gelten, die noch nicht allgemein verfügbar gemacht wurden. Informationen zu dieser spezifischen Vorschau finden Sie unter Informationen zur Vorschau von Azure HDInsight on AKS. Bei Fragen oder Funktionsvorschlägen senden Sie eine Anfrage an AskHDInsight mit den entsprechenden Details, und folgen Sie uns für weitere Updates in der Azure HDInsight-Community.

Trino (früher PrestoSQL) ist ein verteiltes Open-Source-SQL-Abfragemodul für Verbund- und interaktive Analysen anhand heterogener Datenquellen. Es kann Daten im großen Maßstab (Gigabyte bis Petabyte) aus mehreren Quellen abfragen, um unternehmensweite Analysen zu ermöglichen.

Trino wird für eine breite Palette von analytischen Anwendungsfällen verwendet und ist eine hervorragende Wahl für interaktive und Ad-hoc-Abfragen.

Einige der wichtigsten Features, die Trino bietet -

  • Ein adaptives mehrinstanzenfähiges System, das hunderte Arbeitsspeicher-, E/A- und CPU-intensive Abfragen gleichzeitig ausführen und auf Tausende von Workerknoten skaliert werden kann und Clusterressourcen dabei effizient nutzt.
  • Erweiterbares und Verbunddesign, um die Komplexität der Integration mehrerer Systeme zu verringern.
  • Hohe Leistung mit mehreren wichtigen Features und Optimierungen.
  • Vollständig kompatibel mit Hadoop-Ökosystem.

Es gibt zwei Arten von Trino-Servern: Koordinatoren und Worker.

Koordinator

Der Trino-Koordinator ist der Server, der für die Analyse von Anweisungen, die Planung von Abfragen und die Verwaltung von Trino-Workerknoten verantwortlich ist. Er ist das „Gehirn“ einer Trino-Installation und ist auch der Knoten, mit dem ein Client eine Verbindung herstellt, um Anweisungen zur Ausführung zu übermitteln. Der Koordinator verfolgt die Aktivität auf jedem Worker und koordiniert die Ausführung einer Abfrage. Der Koordinator erstellt ein logisches Modell einer Abfrage, das eine Reihe von Phasen umfasst und in eine Reihe verbundener Aufgaben übersetzt wird, die auf einem Cluster von Trino-Workern ausgeführt werden.

Worker

Ein Trino-Worker ist ein Server in einer Trino-Installation, der für die Ausführung von Aufgaben und die Verarbeitung von Daten verantwortlich ist. Workerknoten rufen Daten von Connectors ab und tauschen Zwischendaten miteinander aus. Der Koordinator ist dafür verantwortlich, Ergebnisse von den Workern abzurufen und die endgültigen Ergebnisse an den Client zurückzugeben.

Diagramm der Trino-Architektur.