PolyBase 横向扩展组

适用于： Windows 上的 SQL Server 2016 （13.x）及更高版本

在处理 Hadoop 或 Azure Blob 存储中的大型数据集时，具有 PolyBase 的独立 SQL Server 实例可能成为性能瓶颈。 PolyBase 组功能允许你创建 SQL Server 实例的群集来处理来自外部数据源的大型数据集（如 Hadoop 或 Azure Blob 存储），从而通过一种扩展的方式提高查询性能。您现在可以扩展 SQL Server 的计算能力，以满足您的工作负载的性能要求。 PolyBase 横向扩展组，即 SQL Server 实例组，使你能够处理并行处理体系结构中的大型外部数据集。向组添加更多 SQL Server 实例可线性提高数据加载和查询性能。

重要

MICROSOFT SQL Server PolyBase 横向扩展组已停用。 SQL Server 2022（16.x）及更高版本中已在产品中移除了横向扩展组功能。 PolyBase 数据虚拟化将在 SQL Server 中作为纵向扩展功能继续完全受支持。有关详细信息，请参阅 Microsoft SQL Server 平台上的大数据选项。

请参阅 SQL Server 中使用 PolyBase 进行数据虚拟化，在 SQL Server 中使用 PolyBase 进行数据虚拟化。

头节点

头节点包含 PolyBase 查询提交到的 SQL Server 实例。每个 PolyBase 组只能有一个头节点。头节点是 SQL Server 实例上 SQL Server 数据库引擎、PolyBase 引擎和 PolyBase 数据移动服务的逻辑组。使用 SQL Server 2017 和 SQL Server 2016 时，头节点必须是企业版。从 SQL Server 2019 开始，PolyBase 头节点可以是企业版或标准版。

计算节点

计算节点包含 SQL Server 实例，该实例协助扩展查询功能，以处理外部数据。计算节点是 SQL Server 和 SQL Server 实例上的 PolyBase 数据移动服务的逻辑组。 PolyBase 组可以有多个计算节点。头节点和计算节点必须都运行相同版本的 SQL Server。 SQL Server 2016 初始版本允许计算节点为企业版或标准版。从 SQL Server 2016 SP1 开始，SQL Server 的所有版本都可以作为计算节点。

横向扩展读取

查询外部 SQL Server、Oracle 或 Teradata 实例时，分区表受益于横向扩展读取。 PolyBase 横向扩展组中的每个节点最多可以旋转 8 个读取器来读取外部数据。并且每个读取器被分配到一个分区，以在外部表中读取。

例如，假设有一个具有 12 个每月分区的外部 SQL Server 表和一个三节点 PolyBase 横向扩展组，每个节点使用四个 PolyBase 读取器来处理 12 个分区中的每一个。下图演示了此方案。

注意

此功能不同于通过 Hadoop 进行的横向扩展读取。

分布式查询处理

PolyBase 查询会提交到头节点上的 SQL Server。查询中引用外部表的那部分会移交给 PolyBase 引擎。

PolyBase 引擎是 PolyBase 查询背后的关键组件。它分析外部数据的查询，生成查询计划，并将工作分发到计算节点上的数据移动服务以供执行。完成工作后，它将接收来自计算节点的结果，并将其提交给 SQL Server 进行处理并返回到客户端。

PolyBase 数据移动服务接收来自 PolyBase 引擎的指令，并在 HDFS 和 SQL Server 之间以及头节点和计算节点上的 SQL Server 实例之间传输数据。

反馈

此页面是否有帮助？

Last updated on 2026-03-19

PolyBase 横向扩展组

头节点

计算节点

横向扩展读取

分布式查询处理

相关内容

反馈

其他资源