适用于 SQL Server 大数据群集的管理笔记本的索引

此页是适用于 SQL Server 大数据群集的笔记本的索引。 这些可执行笔记本 (.ipynb) 管理适用于 SQL Server 2019 的大数据群集。

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 有关详细信息,请参阅 Microsoft SQL Server 平台上的大数据选项

可以使用 Jupyter 笔记本管理 SQL Server 大数据群集。 执行此操作时,所有笔记本都会检查自己的依赖项。 “运行所有单元格”选项要么成功完成,要么抛出异常,并显示指向另一个笔记本的超链接提示,以解决缺少依赖项的问题。 按照指向目标笔记本的提示超链接,单击“运行所有单元格”。 成功完成后,返回到原始笔记本,然后选择“运行所有单元格”。

安装所有依赖项且“运行所有单元格”失败后,每个笔记本都会分析结果。 如果可能,超链接提示提供有关如何解决问题的说明。

在大数据群集上安装和卸载实用工具

下面是一组可用于安装和卸载命令行工具的笔记本。 它们还提供用于管理 SQL Server 大数据群集的包。

名称 说明
SOP012 - 安装适用于 Mac 的 unixodbc 如果在使用 brew 安装适用于 SQL Server 的 odbc 时出错,则使用此笔记本。
SOP036 - 安装 kubectl 命令行接口 使用此笔记本来安装 kubectl 命令行接口,而不用考虑你的 OS。
SOP037 - 卸载 kubectl 命令行接口 使用此笔记本来卸载 kubectl 命令行接口,而不用考虑你的 OS。
SOP038 - 安装 Azure 命令行接口 使用此笔记本来安装 Azure CLI 命令行接口,而不用考虑你的 OS。
SOP040 - 在 ADS Python 沙盒中升级 pip 使用此笔记本在 ADS Python 沙盒中升级 pip。
SOP059 - 安装 Kubernetes Python 模块 使用此笔记本来通过 Python 安装 Kubernetes 模块。
SOP060 - 卸载 kubernetes 模块 使用此笔记本来通过 Python 卸载 Kubernetes 模块。
SOP062 - 安装 python-sql 和 pyodbc 模块 使用此笔记本来安装 ipython-sql 和 pyodbc 模块。
SOP069 - 安装 ODBC for SQL Server 使用此笔记本来安装 ODBC 驱动程序,因为 azdata 中的某些子命令需要 SQL Server ODBC 驱动程序。

备份和还原大数据群集

下面是一组可用于备份和还原 SQL Server 大数据群集操作的笔记本。

名称 说明
SOP008 - 使用 distcp 将 HDFS 文件备份到 Azure Data Lake Store Gen2 此标准操作过程 (SOP) 将数据从源大数据群集的 HDFS 文件系统备份到你指定的 Azure Data Lake Store Gen2 帐户。 请确保已将 Azure Data Lake Store Gen2 帐户配置为启用了“分层命名空间”。

管理大数据群集上的证书

下面是一组用于管理大数据群集上的证书的笔记本。

名称 说明
CER001 - 生成根 CA 证书 生成根 CA 证书。 考虑在每个环境中对所有非生产群集使用一个根 CA 证书,因为这种技术减少了需要上传到连接到这些群集的客户端的根 CA 证书的数量。
CER002 - 下载现有根 CA 证书 使用此笔记本从群集下载已生成的根 CA 证书。
CER003 - 上传现有根 CA 证书 CER003 - 上传现有根 CA 证书。
CER004 - 下载和上传现有根 CA 证书 下载和上传现有根 CA 证书。
CER005 - 安装新的根 CA 证书 安装新的根 CA 证书。
CER010 - 在本地安装已生成的根 CA 此笔记本会在本地(从大数据群集)复制使用“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”安装的已生成的根 CA 证书,然后将根 CA 证书安装到此计算机的本地证书存储中 。
CER020 - 创建 Management Proxy 证书 此笔记本为 Management Proxy 终结点创建证书。
CER021 - 创建 Knox 证书 此笔记本为 Knox Gateway 终结点创建证书。
CER022 - 创建 App Proxy 证书 此笔记本为 App Deploy Proxy 终结点创建证书。
CER023 - 创建 Master 证书 此笔记本为 Master 终结点创建证书。
CER024 - 创建控制器证书 此笔记本为控制器终结点创建证书。
CER025 - 上传现有管理代理证书 此笔记本上传现有管理代理证书。
CER026 - 上传现有网关证书 此笔记本将外部生成的网关证书上传到群集。
CER027 - 上传现有应用服务代理证书 此笔记本将外部生成的应用服务证书上传到群集。
CER028 - 上传现有 Master 证书 此笔记本将外部生成的 Master 证书上传到群集。
CER028 - 上传现有控制器证书 此笔记本将外部生成的控制器证书上传到群集。
CER030 - 使用已生成的 CA 对 Management Proxy 证书进行签名 此笔记本使用通过“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”生成的根 CA 证书,对使用“CER020 - 创建 Management Proxy 证书”创建的证书进行签名
CER031 - 使用已生成的 CA 对 Knox 证书进行签名 此笔记本使用通过“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”生成的根 CA 证书,对使用“CER021 - 创建 Knox 证书”创建的证书进行签名
CER032 - 使用已生成的 CA 对 App-Proxy 证书进行签名 此笔记本使用通过“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”生成的根 CA 证书,对使用“CER022 - 创建 App Proxy 证书”创建的证书进行签名。
CER033 - 使用已生成的 CA 对 Master 证书进行签名 此笔记本使用通过“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”生成的根 CA 证书,对使用“CER023 - 创建 Master 证书”创建的证书进行签名。
CER034 - 使用已生成的 CA 对控制器证书进行签名 此笔记本使用通过“CER001 - 生成根 CA 证书”或“CER003 - 上传现有根 CA 证书”生成的根 CA 证书,对使用“CER024 - 创建控制器证书”创建的证书进行签名。
CER040 - 安装已签名的 Management Proxy 证书 此笔记本将使用“CER030 - 使用已生成的 CA 对 Management Proxy 证书进行签名”签名的证书安装到大数据群集中。
CER041 - 安装已签名的 Knox 证书 此笔记本将使用“CER031 - 使用已生成的 CA 对 Knox 证书进行签名”签名的证书安装到大数据群集中。
CER042 - 安装已签名的 App-Proxy 证书 此笔记本将使用“CER032 - 使用已生成的 CA 对 App-Proxy 证书进行签名”签名的证书安装到大数据群集中。
CER043 - 安装已签名的 Master 证书 此笔记本将使用“CER033 - 使用群集根 CA 对 Master 证书进行签名”签名的证书安装到大数据群集中。请注意,在此笔记本的最后,主 Pod 将重启来加载新证书。
CER044 - 安装已签名的控制器证书 此笔记本将使用“CER034 - 使用群集根 CA 对 Controller 证书进行签名”签名的证书安装到大数据群集中。请注意,在此笔记本的最后,Controller Pod 和所有使用 PolyBase 的 Pod(主池 Pod 和计算池 Pod)将重启来加载新证书。
CER050 - 等待 BDC 恢复正常状态 在 Controller Pod 和使用 PolyBase 的 Pod 已重启来加载新证书后,此笔记本将等待大数据群集恢复正常状态。
CER100 - 为群集配置自签名证书 此笔记本会在大数据群集中生成新的根 CA,并为每个终结点创建新的证书(这些终结点是:Management、Gateway、App-Proxy 和 Controller)。 使用已生成的新根 CA 对每个新证书进行签名(Controller 证书除外,此类证书使用现有群集根 CA 进行签名),然后将每个证书安装到大数据群集中。 将已生成的新根 CA 下载到此计算机的“受信任的根证书颁发机构”证书存储中。 所有已生成的自签名证书都将存储在 test_cert_store_root 位置处的控制器 Pod 中。
CER101 - 使用现有根 CA 为群集配置自签名证书 此笔记本会使用大数据群集中已生成的现有根 CA(使用 CER003 进行上传),并为每个终结点(Management、Gateway、App-Proxy 和 Controller)创建新的证书,然后使用已生成的新根 CA 对每个新证书进行签名(Controller 证书除外,此类证书使用现有群集根 CA 进行签名),将每个证书安装到大数据群集中。 所有已生成的自签名证书都将存储在 test_cert_store_root 位置处的控制器 Pod 中。 在完成此笔记本后,从此计算机(以及任何安装了新根 CA 的计算机)对大数据群集进行的所有 https:// 访问都将显示为安全。 “笔记本运行程序”一章将确保创建用于运行 App-Deploy 的 CronJob (OPR003),并将安装群集根 CA,以允许安全获取 JWT 令牌和 swagger.json。
CER102 - 使用现有大数据群集 CA 为群集配置自签名证书 此笔记本将使用现有大数据群集 CA 为群集配置自签名证书。 阅读笔记本以获取详细信息。
CER103 - 为群集配置外部签名证书 此笔记本的用途是将终结点证书轮换为在大数据群集之外生成并签名的证书。 阅读笔记本以获取详细信息。

大数据群集上的静态加密实用工具

本部分包含一组可用于管理 BDC 上的静态加密的笔记本。

名称 描述
SOP0124 - 列出静态加密密钥 使用此笔记本列出所有 HDFS 密钥。
SOP0128 - 在大数据群集中启用 HDFS 加密区域 从 CU6 或更早版本升级到 CU8 时,请使用此笔记本启用 HDFS 加密区域。 新部署 CU8 和更高版本或升级到 CU9 时不需要。
SOP0125 - 删除静态加密密钥 使用此笔记本删除 HDFS 加密区域密钥。 警告!
SOP0126 - 备份静态加密密钥 使用此笔记本备份 HDFS 加密区域密钥。
SOP0127 - 还原静态加密密钥 使用此笔记本还原 HDFS 加密区域密钥。

密码轮换

用于管理大数据群集上的密码轮换的笔记本。

名称 说明
PASS001 - 更新管理员域控制器密码 此笔记本假设已在域控制器中更新了 DSA 密码。 通过给定的参数运行此笔记本,以使用新的 DSA 密码更新大数据群集。 此操作将重启控制器 Pod。

后续步骤

有关 SQL Server 大数据群集的详细信息,请参阅 SQL Server 2019 大数据群集简介