共用方式為


什麼是 Trino? (預覽)

重要

此功能目前為預覽功能。 適用於 Microsoft Azure 預覽版的補充使用規定包含適用於 Beta 版、預覽版或尚未發行至正式運作之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊的 Azure HDInsight。 如需問題或功能建議,請在 AskHDInsight提交要求,並提供詳細數據,並遵循我們在 Azure HDInsight 社群取得更多更新。

Trino (先前稱為 PrestoSQL) 是開放原始碼分散式 SQL 查詢引擎,可用於針對異質數據源進行同盟和互動式分析。 它可以從多個來源大規模查詢數據(GB 到 PB),以啟用全企業分析。

Trino 用於各種分析使用案例,是互動式和臨機操作查詢的絕佳選擇。

Trino 提供的一些主要功能 -

  • 可同時執行數百個記憶體、I/O 和 CPU 密集查詢的調適型多租用戶系統,並調整為數千個背景工作節點,同時有效率地利用叢集資源。
  • 可延伸和同盟設計,以減少整合多個系統的複雜性。
  • 高效能,具有數個主要相關功能和優化。
  • 與 Hadoop 生態系統完全相容。

Trino 伺服器有兩種類型:協調器和背景工作角色。

協調器

Trino 協調器是負責剖析語句、規劃查詢和管理 Trino 背景工作節點的伺服器。 這是 Trino 安裝的「大腦」,也是用戶端連接以提交語句來執行的節點。 協調器會追蹤每個背景工作角色的活動,並協調查詢的執行。 協調器會建立查詢的邏輯模型,其中包含一系列階段,其會轉譯成一系列連線的工作在 Trino 背景工作叢集上執行。

工作人員

Trino 背景工作角色是 Trino 安裝中的伺服器,負責執行工作和處理數據。 背景工作節點會從連接器擷取數據,並彼此交換元數據。 協調器負責從背景工作角色擷取結果,並將最終結果傳回用戶端。

顯示 Trino 架構的圖表。