什么是 SQL Server 中独立的 Machine Learning Server 或 R Server?

适用于:SQL Server 2016 (13.x) 及更高版本

重要

2022 年 7 月 1 日终止对 Machine Learning Server(以前称为 R Server)的支持。 有关详细信息,请参阅 Machine Learning Server 将发生什么情况?

SQL Server 为独立于 SQL Server 运行的独立 R Server 或 Machine Learning Server 提供安装支持。 根据 SQL Server 版本,独立服务器具有开放源代码 R 基础(可能是 Python),它们与 Microsoft 提供的具有大规模统计和预测分析功能的高性能库重叠。 库还能启用通过 R 或 Python 编写脚本的机器学习任务。

在 SQL Server 2016 中,此功能称为 R Server(独立版),且仅用于 R 。 在 SQL Server 2017 中,它称为 Machine Learning Server(独立版),且包括 R 和 Python 。

注意

独立服务器由 SQL Server 安装程序进行安装,其在功能上等同于 Microsoft Machine Learning Server 的非 SQL 品牌版本,支持相同的用户方案,包括远程执行、操作化和 Web 服务,以及 R 库和 Python 库的完整集合。

组件

SQL Server 2016 仅支持 R。 SQL Server 2017 支持 R 和 Python。 下表介绍了每个版本中的功能。

组件 说明
R 包 RevoScaleR 是可缩放 R 的主库,具有用于数据操作、转换、可视化和分析的函数 。
MicrosoftML 添加了机器学习算法,以便为文本分析、图像分析和情绪分析创建自定义模型 。
sqlRUtils 提供了帮助程序函数,用于将 R 脚本置于 T-SQL 存储过程中、向数据库注册存储过程,以及从 R 开发环境运行存储过程 。
olapR 用于在 R 中指定 MDX 查询。
Microsoft R Open (MRO) Microsoft R Open(已停用)是 Microsoft 的 R 开源发行版。
R 工具 R 控制台窗口和命令提示符是 R 分发版中的标准工具。 可在 \Program files\Microsoft SQL Server\140\R_SERVER\bin\x64 查找它们。
R 示例和脚本 开放源代码 R 和 RevoScaleR 包中包括内置数据集,因此可以使用预安装的数据来创建和运行脚本。 可在 \Program files\Microsoft SQL Server\140\R_SERVER\library\datasets and \library\RevoScaleR 查找它们。
Python 包 revoscalepy 是可缩放 Python 的主库,具有用于数据操作、转换、可视化和分析的函数 。
microsoftml 添加了机器学习算法,以便为文本分析、图像分析和情绪分析创建自定义模型 。
Python 工具 内置的 Python 命令行工具适用于临时测试和任务。 可在 \Program files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe 查找此工具。
Anaconda Anaconda 是 Python 和基本包的开放源代码分发。
Python 示例和脚本 与 R 一样,Python 包含内置的数据集和脚本。 可在 \Program files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data 查找 revoscalepy 数据。
R 和 Python 中的预定型模型 预定型模型是为特定用例创建的,由 Microsoft 数据科学工程团队维护。 可以按原样使用预定型模型对文本中的正面-负面情绪进行评分,或使用你提供的新数据输入来检测图像中的特征。 预定型模型在独立服务器上受支持且可用,但无法通过 SQL Server 安装程序对其进行安装。 有关详细信息,请参阅在 SQL Server 上安装预定型机器学习模型

使用独立服务器

R 和 Python 开发者通常会选择独立服务器,以打破开放源代码 R 和 Python 的内存和处理限制。 在独立服务器上执行的 R 和 Python 库可以在多个核心上加载和处理大量数据,并将结果聚合到单个合并输出中。 高性能函数专为规模和实用性而设计:在 Microsoft 设计和支持的商业服务器软件中,提供预测分析、统计建模、数据可视化和领先的机器学习算法。

作为与 SQL Server 分离的独立服务器,其 R 和 Python 环境是使用独立服务器(而非 SQL Server)中提供的基础操作系统和标准工具进行配置、保护和访问的。 没有对 SQL Server 关系数据的内置支持。 如果要使用 SQL Server 数据,可以创建数据源对象和连接(就像从任何客户端创建数据源对象和连接一样)。

如果需要进行本地计算和远程计算,则作为 SQL Server 的附属物的独立服务器还可用作功能强大的开发环境。 独立服务器上的 R 和 Python 包与随数据库引擎安装提供的 R 和 Python 包相同,允许实现代码可移植性和计算上下文切换

如何入门

从安装程序开始,将二进制文件附加到你最喜爱的开发工具中,然后编写你的第一个脚本。

步骤 1:安装软件

安装以下任一版本:

步骤 2:配置开发工具

在独立服务器上,通常使用安装在同一台计算机上的开发工具在本地执行工作。

步骤 3:编写你的第一个脚本

使用 RevoScaleR、revoscalepy 和机器学习算法中的函数来编写 R 或 Python 脚本。

选择最适合任务的语言。 R 非常适合用于使用 SQL 难以实现的统计计算。 对数据进行基于集的操作时,可利用强大的 SQL Server 来实现最佳的性能。 对列进行快速计算时,可使用内存数据库引擎。

步骤 4:操作你的解决方案

独立服务器可以使用非 SQL 品牌 Microsoft Machine Learning Server操作化功能。 可以为操作化配置独立服务器,这样配置具有以下好处:将代码作为 Web 服务部署和托管、运行诊断、测试 Web 服务容量。

步骤 5:维护服务器

SQL Server 定期发布累积更新。 应用累积更新可以增强现有安装的安全性和功能。

有关新功能或更改的功能的说明,请参阅 CAB 下载文章和 Web 页上的 SQL Server 2016 累积更新SQL Server 2017 累积更新

有关如何将更新应用到现有实例的详细信息,请参阅安装说明中的应用更新

另请参阅

安装 R Server(独立版)或 Machine Learning Server(独立版)