¿Qué herramientas incluye La máquina virtual de Azure Ciencia de datos?
Puede usar el Ciencia de datos máquina virtual (DSVM) para explorar fácilmente los datos y controlar el aprendizaje automático en la nube. Una DSVM está preconfigurada con revisiones de seguridad, controladores, software de ciencia de datos y desarrollo populares y un sistema operativo completo. Puede elegir el entorno de hardware que funciona automáticamente, desde máquinas centradas en CPU de menor costo hasta máquinas eficaces con varias GPU, almacenamiento NVMe y grandes cantidades de memoria. En el caso de las máquinas con GPU, se instalan todos los controladores y todos los marcos de aprendizaje automático coinciden con la versión para la compatibilidad con GPU. Además, la aceleración está habilitada en todo el software de aplicación que admite GPU.
DSVM incluye las herramientas de ciencia de datos más útiles preinstaladas.
Creación de aprendizaje profundo y soluciones de aprendizaje automático
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
CUDA, cuDNN, NVIDIA Driver | ✅ | ✅ | ✅ |
CUDA, cuDNN y controlador NVIDIA en DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod en DSVM |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi en DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch en DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow en DSVM |
Integración con Azure Machine Learning (Python) | ✅ (Python SDK, ejemplos) |
✅ (Python SDK, ejemplos) |
✅ (SDK de Python, CLI y ejemplos) |
SDK de Azure Machine Learning |
XGBoost | ✅ (Compatibilidad con CUDA) |
✅ (Compatibilidad con CUDA) |
✅ (Compatibilidad con CUDA) |
XGBoost en DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit en DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (Compatibilidad con GPU, MPI) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Solo contenedores de Windows) |
✅ (Solo contenedores de Windows) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
Almacenamiento, recuperación y manipulación de datos
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Bases de datos relacionales | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server en DSVM |
Herramientas de base de datos | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (herramienta de consulta), bcp, sqlcmd Controladores ODBC/JDBC |
|
Explorador de Azure Storage | ✅ |
✅ |
||
CLI de Azure | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | AzCopy en DSVM |
Controlador FUSE de blob | ❌ | ❌ | ❌ |
blobfuse en DSVM |
Herramienta de migración de datos de Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB en DSVM |
Herramientas de línea de comandos de Unix o Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (independiente) | ✅ | ✅ | ✅ |
Programa en Python, R, Julia y Node.js
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
CRAN-R con paquetes populares preinstalados | ✅ | ✅ | ✅ | |
Anaconda Python con paquetes populares preinstalados | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (servidor de cuadernos multiusuario) | ❌ | ❌ | ✅ | |
JupyterLab (servidor de cuadernos multiusuario) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Servidor de Jupyter Notebook con los siguientes kernels: | ✅ |
✅ |
✅ | Ejemplos de Jupyter Notebook |
R | Ejemplos de Jupyter R | |||
Python | Ejemplos de Python Jupyter | |||
Julia | Ejemplos de Julia Jupyter | |||
PySpark | Ejemplos de pySpark Jupyter |
DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen estos kernels de Jupyter:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7: Spark (local)
- Julia 1.6.0
- R Spark: HDInsight
- Scala Spark: HDInsight
- Python 3 Spark: HDInsight
DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen los siguientes entornos de conda:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Uso del editor o IDE preferidos
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio en DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code en DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm en DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git y Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
SDK de Azure | ✅ |
✅ | ✅ |
Organización y presentación de resultados
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Explorador Microsoft Edge | ✅ | ✅ | ✅ |