你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 数据科学虚拟机包含哪些工具?

可以使用 数据科学 虚拟机(DSVM)轻松浏览数据和处理云中的机器学习。 DSVM 预配置了安全修补程序、驱动程序、热门数据科学和开发软件以及完整的操作系统。 可以选择适合你的硬件环境,从低成本的以 CPU 为中心的计算机到具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于具有 GPU 的计算机,会安装所有驱动程序,并且所有机器学习框架都与 GPU 兼容性进行版本匹配。 此外,所有支持 GPU 的应用程序软件中都启用了加速。

DSVM 附带预装的最有用的数据科学工具。

构建深度学习和机器学习解决方案

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
CUDA、cuDNN、NVIDIA 驱动程序
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序
Horovod DSVM 上的 Horovod
NVidia System Management Interface (nvidia-smi) DSVM 上的 nvidia-smi
PyTorch DSVM 上的 PyTorch
TensorFlow
DSVM 上的 TensorFlow
Azure 机器学习 (Python) 集成
(Python SDK、示例)

(Python SDK、示例)

(Python SDK、CLI、示例)
Azure 机器学习 SDK
XGBoost
(CUDA 支持)

(CUDA 支持)

(CUDA 支持)
DSVM 上的 XGBoost
Vowpal Wabbit
DSVM 上的 Vowpal Wabbit
Weka
LightGBM
(GPU 和 MPI 支持)
H2O
CatBoost
Intel MKL
OpenCV
Dlib
Docker
(仅限 Windows 容器)

(仅限 Windows 容器)
Nccl
Rattle
PostgreSQL
ONNX 运行时

存储、检索和操作数据

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
关系数据库 SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
DSVM 上的 SQL Server
数据库工具 SQL Server Management Studio
SQL Server Integration Services
bcp、sqlcmd
SQL Server Management Studio
SQL Server Integration Services
bcp、sqlcmd
SQuirreL SQL(查询工具)
bcp、sqlcmd
ODBC/JDBC 驱动程序
Azure 存储资源管理器

Azure CLI


AzCopy

DSVM 上的 AzCopy
Blob FUSE 驱动程序
DSVM 上的 blobfuse
Azure Cosmos DB 数据迁移工具 DSVM 上的 Azure Cosmos DB
Unix/Linux 命令行工具
Apache Spark 3.1(独立版)

使用 Python、R、Julia 和 Node.js 编程

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
预安装常用包的 CRAN-R
预安装常用包的 Anaconda Python
(Miniconda)

(Miniconda)
Julia (Julialang)
JupyterHub(多用户 Notebook 服务器)
JupyterLab(多用户 Notebook 服务器)
Node.js
带有以下内核的 Jupyter Notebook Server

Jupyter Notebook 示例
     R R Jupyter 示例
     Python Python Jupyter 示例
     Julia Julia Jupyter 示例
     PySpark pySpark Jupyter 示例

Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核:

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML
  • R
  • Python 3.7 - Spark(本地)
  • Julia 1.6.0
  • R Spark – HDInsight
  • Scala Spark – HDInsight
  • Python 3 Spark - HDInsight

Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境:

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML

使用你喜欢的编辑器或 IDE

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
Notepad++


Nano


Visual Studio 2019 Community Edition
DSVM 上的 Visual Studio
Visual Studio Code


DSVM 上的 Visual Studio Code
PyCharm Community Edition


DSVM 上的 PyCharm
IntelliJ IDEA
Vim
Emacs
Git 和 Git Bash


OpenJDK 11


.NET Framework

Azure SDK

组织和展示结果

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
Microsoft 365(Word、Excel、PowerPoint)
Microsoft Teams
Power BI Desktop
Microsoft Edge 浏览器