Visual Studio 中的数据科学和分析应用程序工作负载汇集了多种语言及其各自的运行时分发:
Python 是用于数据科学的主要脚本语言。 Python 易于学习,并且支持丰富的包生态系统。 这些包解决了各种方案,例如数据收集、清理、模型训练、部署和绘图。 F# 也是一种功能强大的功能优先 .NET 语言,适用于各种数据处理任务。
负载安装
数据科学和分析应用程序工作负载在 Visual Studio 安装程序的 “>其他工具集”下提供:
默认情况下,工作负荷会安装以下选项,可以在 Visual Studio 安装程序中工作负载的摘要部分修改这些选项:
- F# 桌面语言支持
- 蟒:
- Python 语言支持
- Python Web 支持
- Python 本机开发工具
SQL Server 集成
SQL Server 支持使用 Python 直接在 SQL Server 内部执行高级分析。 SQL Server 2017 CTP 2.0 及更高版本中提供了 Python 支持。
通过在数据驻留处运行代码,可以享受以下优势:
消除数据移动:可以在数据库中生成应用程序,而不是将数据从数据库移动到应用程序或模型。 此功能消除了与移动大量数据相关的安全、合规性、治理、完整性和许多类似问题。 还可以使用客户端计算机内存无法容纳的数据集。
轻松部署:准备好模型后,将其部署到生产环境是将模型嵌入 T-SQL 脚本的简单事项。 然后,任何以任何语言编写的 SQL 客户端应用程序都可以通过存储过程调用利用模型和智能。 不需要特定的语言集成。
企业级性能和规模:可以使用 SQL Server 的高级功能,例如内存中表和列存储索引,以及 RevoScale 包中的高性能可缩放 API。 消除数据移动也意味着在数据增长或想要提高应用程序性能时避免客户端内存约束。
丰富的扩展性:可以在 SQL Server 中安装和运行任何最新的开源包,以基于 SQL Server 中的大量数据生成深度学习和 AI 应用程序。 在 SQL Server 中安装包与在本地计算机上安装包一样简单。
广泛可用性无需额外付费:语言集成在所有 SQL Server 2017 及更高版本中都可用,包括 Express 版本。
SQL Server 集成安装
若要充分利用 SQL Server 集成,请使用 Visual Studio 安装程序安装 工作负载>“其他工具集>”数据存储和处理 工作负荷。 选择 SQL Server Data Tools 选项以启用 SQL IntelliSense、语法突出显示和部署:
有关详细信息,请参阅 SQL Server 2017 中的 Python:增强的数据库内机器学习(博客)。
其他服务和 SDK
除了数据科学和分析应用程序工作负载中的内容外,Visual Studio Code 中的笔记本和用于 Python 的 Azure SDK 也有助于数据科学。
使用 Python 的 Azure SDK,可以轻松地从 Windows、Mac 和 Linux 上运行的应用程序使用和管理 Microsoft Azure 服务。 有关详细信息,请参阅 适用于 Python 开发人员的 Azure。
可以将 Jupyter 扩展与 Visual Studio Code 中的 Notebook 组合在一起,以支持 Jupyter 开发,并使用额外的语言扩展增强项目。 该服务包括 Python、R 和 F# 中的示例笔记本,以帮助你入门。 有关详细信息,请参阅 来自 Microsoft 和 GitHub 的 Notebook 体验。