介绍 SQL Server 大数据群集中的计算池

适用范围:SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

本文介绍 SQL Server 大数据群集中 SQL Server 计算池的作用。 计算池为 SQL Server 大数据群集提供横向扩展计算资源。 它们用于从 SQL Server 主实例中卸载计算工作或中间结果集。 以下部分介绍计算池的体系结构、功能和使用情况。

你还可以观看下面提供的 5 分钟视频,简要了解计算池:

计算池体系结构

计算池由 Kubernetes 中运行的一个或多个计算 pod 组成。 由 SQL Server 主实例来协调这些 pod 的自动创建和管理过程。 每个 pod 包含一组基本服务和一个 SQL Server 数据库引擎的实例。

计算池体系结构

横向扩展组

计算池可充当对不同外部数据源(例如 SQL Server、Oracle、MongoDB、Teradata 和 HDFS)进行的分布式查询的 PolyBase 横向扩展组。 通过使用 Kubernetes 中的计算 Pod,SQL Server 大数据群集可自动为 PolyBase 横向扩展组创建和配置计算 Pod。

计算池场景

使用计算池的场景包括:

  • 当提交到主实例的查询使用存储池中的一个或多个表时。

  • 当提交到主实例的查询使用数据池中具有轮循机制分布的一个或多个表时。

  • 当提交到主实例的查询使用具有 SQL Server、Oracle、MongoDB 和 Teradata 的外部数据源的已分区表时。 在此场景中,必须启用查询提示选项 (FORCE SCALEOUTEXECUTION)。

  • 当提交到主实例的查询使用 HDFS 层中的一个或多个表时。

不使用计算池的场景包括:

  • 当提交到主实例的查询使用外部 Hadoop HDFS 群集中的一个或多个表时。

  • 当提交到主实例的查询使用 Azure Blob 存储中的一个或多个表时。

  • 当提交到主实例的查询使用具有 SQL Server、Oracle、MongoDB 和 Teradata 的外部数据源的未分区表时。

  • 当已启用查询提示选项 (DISABLE SCALEOUTEXECUTION) 时。

  • 当提交到主实例的查询应用于位于主实例上的数据库时。

后续步骤

若要了解有关 SQL Server 大数据群集 的详细信息,请参阅以下资源: