分享方式:


什麼是 Trino? (預覽)

重要

此功能目前為預覽功能。 適用於 Microsoft Azure 預覽版的補充使用規定包含適用於 Beta 版、預覽版或尚未發行至正式運作之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊的 Azure HDInsight。 如需問題或功能建議,請在 AskHDInsight提交要求,並提供詳細數據,並遵循我們在 Azure HDInsight 社群取得更多更新。

Trino (先前稱為 PrestoSQL) 是開放原始碼分散式 SQL 查詢引擎,可用於針對異質數據源進行同盟和互動式分析。 它可以從多個來源大規模查詢數據(GB 到 PB),以啟用全企業分析。

Trino 用於各種分析使用案例,是互動式和臨機操作查詢的絕佳選擇。

Trino 提供的一些主要功能 -

  • 可同時執行數百個記憶體、I/O 和 CPU 密集查詢的調適型多租用戶系統,並調整為數千個背景工作節點,同時有效率地利用叢集資源。
  • 可延伸和同盟設計,以減少整合多個系統的複雜性。
  • 高效能,具有數個主要相關功能和優化。
  • 與 Hadoop 生態系統完全相容。

Trino 伺服器有兩種類型:協調器和背景工作角色。

協調器

Trino 協調器是負責剖析語句、規劃查詢和管理 Trino 背景工作節點的伺服器。 這是 Trino 安裝的「大腦」,也是用戶端連接以提交語句來執行的節點。 協調器會追蹤每個背景工作角色的活動,並協調查詢的執行。 協調器會建立查詢的邏輯模型,其中包含一系列階段,其會轉譯成一系列連線的工作在 Trino 背景工作叢集上執行。

工作人員

Trino 背景工作角色是 Trino 安裝中的伺服器,負責執行工作和處理數據。 背景工作節點會從連接器擷取數據,並彼此交換元數據。 協調器負責從背景工作角色擷取結果,並將最終結果傳回用戶端。

顯示 Trino 架構的圖表。