SQL Server 巨量資料叢集 中主要集區簡介

適用于:SQL Server 2019 (15.x)

重要事項

Microsoft SQL Server 2019 巨量資料叢集附加元件將會淘汰。 SQL Server 2019 巨量資料叢集的支援將于 2025 年 2 月 28 日結束。 如需詳細資訊,請參閱Microsoft SQL Server 平臺上的巨量資料選項

本文說明 SQL Server 巨量資料叢集中的「SQL Server 主要執行個體」角色。 主要集區包含SQL Server的主要實例。 主要實例是在SQL Server巨量資料叢集中執行的SQL Server實例。 主要實例會管理連線能力、向外延展查詢、中繼資料和使用者資料庫,以及機器學習服務。

SQL Server 主要執行個體提供下列功能:

連線能力

SQL Server 主要執行個體為叢集提供可從外部存取的 TDS 端點。 您可以將應用程式或 SQL Server 工具 (例如 Azure Data Studio 或 SQL Server Management Studio) 連線到此端點,就像其他 SQL Server 執行個體一樣。

向外延展查詢管理

SQL Server 主要執行個體包含向外延展查詢引擎,可用來將查詢分散到計算集區中節點上的不同 SQL Server 執行個體。 向外延展查詢引擎也可透過 Transact-SQL 存取叢集中的所有 Hive 資料表,而不需要再進行任何設定。

中繼資料和使用者資料庫

除了標準SQL Server系統資料庫之外,SQL 主要實例也包含:

  • 保存 HDFS 資料表中繼資料的中繼資料資料庫。
  • 資料平面分區對應。
  • 可存取叢集資料平面的外部資料表詳細資料。
  • 定義於使用者資料庫的 PolyBase 外部資料來源和外部資料表。

您也可以選擇將自己的使用者資料庫新增至 SQL Server 主要執行個體。

機器學習服務

SQL Server機器學習服務功能是資料庫引擎的附加元件功能。 機器學習服務功能,用於在 SQL Server 中執行 JAVA、R 和 Python 程式碼。 這項功能是以 SQL Server 擴充性架構為基礎,該架構可將外部處理序自核心引擎處理序隔離,但與預存程序、含有 R 或 Python 陳述式的 T-SQL 指令碼,或是含有 T-SQL 的 Java、R 或 Python 程式碼形式的關聯式資料完全整合。

機器學習服務是 SQL Server 巨量資料叢集的一部分,預設會用在 SQL Server 主要執行個體上。 在SQL Server主要實例上啟用外部腳本執行之後,就可以使用 sp_execute_external_script 來執行 JAVA、R 和 Python 腳本。

巨量資料叢集中的機器學習服務優點

SQL Server 巨量資料叢集可讓您輕鬆地將巨量資料聯結至通常儲存在企業資料庫中的維度資料。 當巨量資料不只是由組織的部分單位掌控,還包含在報表、儀表板和應用程式裡時,將可大幅提升價值。 同時,資料科學家可以繼續使用 Spark/HDFS 生態系統工具,並輕鬆、即時地存取SQL Server主要實例中的資料,以及可透過SQL Server 主要實例存取的外部資料源中的資料。

透過SQL Server 巨量資料叢集,您可以使用企業 Data Lake 執行更多作業。 SQL Server 開發人員和分析師可以:

  • 建置從企業資料湖取用資料的應用程式。
  • 透過 Transact-SQL 查詢的所有資料去推論。
  • 使用 SQL Server 工具和應用程式的現有生態系統,存取及分析企業資料。
  • 透過資料虛擬化和資料超市降低資料移動需求。
  • 繼續針對巨量資料案例使用 Spark。
  • 使用 Spark 或 SQL Server 建置智慧型企業應用程式,透過資料湖將模型定型。
  • 讓生產資料庫中的模型運作以獲得最佳效能。
  • 將資料直接串流到企業資料超市,進行即時分析。
  • 使用互動式分析和 BI 工具,以視覺化方式探索資料。

後續步驟

若要深入瞭解SQL Server 巨量資料叢集,請參閱下列資源: