你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure 数据科学虚拟机包含哪些工具?
可以使用 数据科学 虚拟机(DSVM)轻松浏览数据和处理云中的机器学习。 DSVM 预配置了安全修补程序、驱动程序、热门数据科学和开发软件以及完整的操作系统。 可以选择适合你的硬件环境,从低成本的以 CPU 为中心的计算机到具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于具有 GPU 的计算机,会安装所有驱动程序,并且所有机器学习框架都与 GPU 兼容性进行版本匹配。 此外,所有支持 GPU 的应用程序软件中都启用了加速。
DSVM 附带预装的最有用的数据科学工具。
构建深度学习和机器学习解决方案
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
CUDA、cuDNN、NVIDIA 驱动程序 | ✅ | ✅ | ✅ |
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序 |
Horovod | ❌ | ❌ | ✅ | DSVM 上的 Horovod |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | DSVM 上的 nvidia-smi |
PyTorch | ✅ | ✅ | ✅ | DSVM 上的 PyTorch |
TensorFlow | ✅ | ✅ |
✅ | DSVM 上的 TensorFlow |
与 Azure 机器学习 (Python) 集成 | ✅ (Python SDK、示例) |
✅ (Python SDK、示例) |
✅ (Python SDK、CLI、示例) |
Azure 机器学习 SDK |
XGBoost | ✅ (CUDA 支持) |
✅ (CUDA 支持) |
✅ (CUDA 支持) |
DSVM 上的 XGBoost |
Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM 上的 Vowpal Wabbit |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (GPU 和 MPI 支持) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (仅限 Windows 容器) |
✅ (仅限 Windows 容器) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX 运行时 | ❌ | ❌ | ✅ |
存储、检索和操作数据
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
关系数据库 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM 上的 SQL Server |
数据库工具 | SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQuirreL SQL(查询工具) bcp、sqlcmd ODBC/JDBC 驱动程序 |
|
Azure 存储资源管理器 | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | DSVM 上的 AzCopy |
Blob FUSE 驱动程序 | ❌ | ❌ | ❌ |
DSVM 上的 blobfuse |
Azure Cosmos DB 数据迁移工具 | ✅ | ✅ | ❌ | DSVM 上的 Azure Cosmos DB |
Unix/Linux 命令行工具 | ❌ | ❌ | ✅ | |
Apache Spark 3.1(独立版) | ✅ | ✅ | ✅ |
使用 Python、R、Julia 和 Node.js 编程
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
预安装常用包的 CRAN-R | ✅ | ✅ | ✅ | |
预安装常用包的 Anaconda Python | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub(多用户 Notebook 服务器) | ❌ | ❌ | ✅ | |
JupyterLab(多用户 Notebook 服务器) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
带有以下内核的 Jupyter Notebook Server | ✅ |
✅ |
✅ | Jupyter Notebook 示例 |
R | R Jupyter 示例 | |||
Python | Python Jupyter 示例 | |||
Julia | Julia Jupyter 示例 | |||
PySpark | pySpark Jupyter 示例 |
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark(本地)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark - HDInsight
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
使用你喜欢的编辑器或 IDE
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM 上的 Visual Studio |
Visual Studio Code | ✅ |
✅ |
✅ |
DSVM 上的 Visual Studio Code |
PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM 上的 PyCharm |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git 和 Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
组织和展示结果
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Microsoft 365(Word、Excel、PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Microsoft Edge 浏览器 | ✅ | ✅ | ✅ |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈