Visual Studio 中的数据科学和分析应用程序工作负载

Visual Studio 中的数据科学和分析应用程序工作负载汇集了多种语言及其各自的运行时分发版本:

Python 是用于数据科学的主要脚本语言。 Python 易于学习且由丰富的程序包生态系统提供支持。 这些程序包可应对各种情况,比如数据采集、清理、模型定型、部署和绘制。 F# 还是首款功能强大的 .NET 函数式语言,适用于各种数据处理任务。

显示包含 R、Python 和 F# 代码项目的 Visual Studio 的屏幕截图。

工作负载安装

在 Visual Studio 安装程序中的“工作负载”>“其他工具”下显示数据科学和分析应用程序工作负载:

显示如何在 Visual Studio 安装程序 2022 中选择数据科学和分析应用程序工作负载的屏幕截图。

显示如何在 Visual Studio 安装程序 2019 中选择数据科学和分析应用程序工作负载的屏幕截图。

该工作负载默认安装以下选项,并且可在 Visual Studio 安装程序中工作负载的摘要部分进行修改:

  • F# 桌面语言支持
  • Python:
    • Python 语言支持
    • Python Web 支持
    • Python 本机开发工具

SQL Server 集成

SQL Server 支持使用 Python 直接在 SQL Server 内执行高级分析。 SQL Server 2017 CTP 2.0 及更高版本提供 Python 支持。

通过在已包含数据的位置运行代码,可享受许多优点:

  • 不必移动数据:可以在数据库中生成应用程序,而不必将数据从数据库移到应用程序或模型。 此功能消除了安全性、合规性、治理和完整性方面的障碍,以及移动大量数据导致的一系列类似问题。 还可以使用客户端计算机内存无法容纳的数据集。

  • 简单的部署:准备好模型后,只需将它嵌入 T-SQL 脚本中的模型,即可部署到生产环境。 之后,用任何语言编写的任何 SQL 客户端应用程序就都能通过存储过程调用充分利用这些模型和智能。 无需特定的语言集成。

  • 企业级性能和可缩放性:可将 SQL Server 的内存中表和列存储索引等高级功能与 RevoScale 程序包中的高性能、可缩放 API 结合使用。 不必移动数据还意味着在数据增长或想要提高应用程序性能时不存在客户端内存约束。

  • 丰富的扩展性:可在 SQL Server 中安装和运行任何最新的开源程序包,从而基于 SQL Server 中的大量数据生成深入学习和 AI 应用程序。 在 SQL Server 中安装程序包与在本地计算机上安装程序包一样简单。

  • 广泛的可用性,且不增加任何成本:SQL Server 2017 及更高版本的所有版本(包括 Express Edition)均提供语言集成。

SQL Server 集成安装

要充分利用 SQL Server 集成,请使用 Visual Studio 安装程序安装“工作负载”>“其他工具”“>数据存储和处理”工作负载。 选择“SQL Server Data Tools”选项,以支持 SQL IntelliSense、语法突出显示和部署:

显示如何在 Visual Studio 安装程序 2022 中选择数据存储和处理工作负载的屏幕截图。

显示如何在 Visual Studio 安装程序 2019 中选择数据存储和处理工作负载的屏幕截图。

有关详细信息,请参阅 SQL Server 2017 中的 Python:增强版数据库内机器学习(博客)

其他服务和 SDK

除数据科学和分析应用程序工作负载中的功能外,Visual Studio Code 中的 Notebooks 和 Azure SDK for Python 也对数据科学有所助益。

Azure SDK for Python 使得从运行在 Windows、Mac 和 Linux 上的应用程序中使用和管理 Microsoft Azure 服务更加方便。 有关详细信息,请参阅面向 Python 开发人员的 Azure

可以将 Jupyter 扩展与 Visual Studio Code 中的 Notebook 组合在一起,以支持 Jupyter 开发,并使用额外的语言扩展增强项目。 此服务包括用 Python、R 和 F# 编写的示例笔记本,可帮助用户入门。 有关详细信息,请参阅微软和 GitHub 中的 Notebooks 体验

显示 R 示例简介中 Notebooks 与 Jupyter 配合使用的屏幕截图。