安装 SQL Server 2019 大数据工具

适用范围:SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

本文介绍为创建、管理和使用 SQL Server 2019 大数据群集 而应安装的客户端工具。 以下部分提供了工具列表和安装说明链接。 在部署大数据群集之前,请先配置 Windows 或 Linux 上标记为必需的工具。

大数据群集工具

下表列出了常见的大数据群集工具及其安装方式:

工具 必选 说明 安装
python Python 是一种使用动态语义解释的面向对象的高级编程语言。 SQL Server 大数据群集的许多部分都使用 python。 安装 python
Azure Data CLI (azdata) 用于安装和管理大数据群集的命令行工具。 安装
kubectl1 用于监视基础 Kubernetes 群集的命令行工具(详细信息)。 Windows | Linux
Azure Data Studio 用于查询 SQL Server 的跨平台图形工具。 安装
数据虚拟化扩展 提供数据虚拟化向导的 Azure Data Studio 的扩展。 安装
Azure CLI2 针对 AKS 用于管理 Azure 服务的新式命令行接口。 与 AKS 大数据群集部署配合使用(详细信息)。 安装
mssql-cli 可选 用于查询 SQL Server 的新式命令行接口(详细信息)。 Windows | Linux
sqlcmd 针对某些脚本 用于查询 SQL Server 的旧式命令行工具(详细信息)。 安装 SQLCMD 包前,你可能需要安装 Microsoft ODBC Driver 11 for SQL Server。 Windows | Linux
curl 3 针对某些脚本 使用 URL 传输数据的命令行工具。 Windows | Linux:安装 curl 包
oc 是 Red Hat OpenShift 和 Azure Red Hat OpenShift 部署所必需的。 oc 是 Open Shift 命令行接口 (CLI)。 安装 CLI

1 必须使用 kubectl 版本 1.13 或更高版本。 此外,kubectl 的版本应该加或减 Kubernetes 群集的一个次要版本。 要在 kubectl 客户端上安装特定版本,请参阅通过 curl 安装 kubectl 二进制文件(在 Windows 10 和 Windows 11 上,使用 cmd.exe 而不是 Windows PowerShell 来运行 curl)。

提示

若要在 Azure Kubernetes 服务 (AKS) 上将 kubectl 与先前部署的群集配合使用,必须使用以下 Azure CLI 命令设置群集上下文:

az aks get-credentials --name <aks_cluster_name> --resource-group <azure_resource_group_name>

2 必须使用 Azure CLI 版本 2.0.4 或更高版本。 如果需要,可运行 az --version 来查找版本。

3 如果在 Windows 10 或 Windows 11 上运行,则从 cmd 提示符运行时,curl 就已经在你的路径中。 对于其他 Windows 版本,请使用链接下载 curl 并将其放在你的路径中。

需要哪些工具?

上表提供了适用于大数据群集的所有常见工具。 具体需要哪些工具取决于你的方案。 但总的来说,以下工具对于管理、连接和查询群集最为重要:

  • Azure Data CLI (azdata)
  • kubectl
  • Azure Data Studio
  • 数据虚拟化扩展

其余工具仅在某些情况下需要。 Azure CLI 可用于管理与 AKS 部署相关联的 Azure 服务。 mssql-cli 是一个可选但有用的工具,可用于连接到群集中的 SQL Server 主实例并从命令行运行查询。 如果计划使用 GitHub 脚本安装示例数据,则需要 sqlcmd 和 curl

脱机安装 python

  1. 在具有 Internet 访问权限的计算机上,下载以下包含 Python 的压缩文件之一:

    操作系统 下载
    Windows https://go.microsoft.com/fwlink/?linkid=2074021
    Linux https://go.microsoft.com/fwlink/?linkid=2065975
    OSX https://go.microsoft.com/fwlink/?linkid=2065976
  2. 将压缩文件复制到目标计算机,并将其解压缩到所选文件夹中。

  3. (仅适用于 Windows)从该文件夹运行 installLocalPythonPackages.bat,并将完整路径作为参数传递到同一文件夹。

    installLocalPythonPackages.bat "C:\python-3.6.6-win-x64-0.0.1-offline\0.0.1"
    

下载并安装 Azure Data Studio

Azure Data Studio 专门为 SQL Server 大数据群集提供功能和特性。

获取最新的 Azure Data Studio

有关最新版本的详细信息,请参阅发行说明

后续步骤

配置工具后,将 SQL Server 2019 大数据群集部署到云中或本地的 Kubernetes。 有关详细信息,请参阅以下部署文章:

有关大数据群集的详细信息,请参阅 SQL Server 2019 大数据群集简介