配置 SQL Server 大数据群集

适用于: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

配置管理使管理员能够确保其大数据群集始终能够满足其工作负载需求。 利用此功能,群集管理员可以在部署时或部署后更改或调整大数据群集的各个部分,更深入地了解其大数据群集中运行的配置。

管理员可使用配置管理功能来启用 SQL 代理,为其组织的 Spark 作业定义基线资源,甚至查看每个范围可配置的设置。 部署时,可通过部署 bdc.json 文件进行配置,部署后,可通过 azdata CLI 进行配置。

配置范围

大数据群集配置具有两个范围级别:clusterserviceresource。 这些设置的层次结构也遵循此顺序,即从最高到最低。 BDC 组件将使用在最低范围定义的设置的值。 如果未在给定范围定义设置,则它将继承其更高的父范围中的值。

例如,最好定义 Spark 驱动程序将在存储池和 Sparkhead 资源中使用的默认核心数。 若要定义默认的核心数,可以执行以下操作之一:

  • Spark 服务范围指定默认内核值

  • storage-0sparkhead 资源范围指定默认内核值

在第一种方案中,Spark 服务的所有较低范围的资源(存储池和 Sparkhead)都将从 Spark 服务默认值继承默认核心数。

在第二种方案中,每个资源将使用在其各自范围中定义的值。

如果在服务和资源范围同时配置了默认内核数,则资源范围的值将替代服务范围值,因为这是用户针对给定设置配置的最低范围。

后续步骤

有关配置的具体信息,请参阅相应文章:

参考: