¿Qué es Azure Data Science Virtual Machine de Azure para Linux y Windows?

Data Science Virtual Machine (DSVM) es una imagen de máquina virtual personalizada en la plataforma en la nube de Azure diseñada específicamente para realizar ciencia de datos. Tiene muchas herramientas de ciencias de datos populares preinstaladas y preconfiguradas para impulsar la creación de aplicaciones inteligentes para análisis avanzado.

El DSVM está disponible en:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Además, nos complace ofrecer Azure DSVM para PyTorch, que es una imagen de Ubuntu 20.04 de Azure Marketplace que está optimizada para grandes cargas de trabajo de aprendizaje profundo distribuidas. Viene preinstalado y validado con la versión más reciente de PyTorch para reducir los costos de configuración y acelerar la rentabilidad. Viene empaquetado con varias funcionalidades de optimización (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex) y una pila actualizada con las versiones más recientes compatibles de Ubuntu, Python, PyTorch, CUDA.

Comparación con Azure Machine Learning

DSVM es una imagen de máquina virtual personalizada para la ciencia de datos, en tanto que Azure Machine Learning es una plataforma de un extremo a otro que abarca:

  • Proceso totalmente administrado
    • Compute Instances (Instancias de proceso)
    • Clústeres de proceso para tareas distribuidas de aprendizaje automático
    • Clústeres de inferencia para puntuaciones en tiempo real
  • Almacenes de datos (por ejemplo, Blob, ADLS Gen2, base de datos SQL)
  • Seguimiento de experimentos
  • Administración de modelos
  • Cuaderno
  • Entornos (administración de las dependencias de Conda y R)
  • Etiquetado
  • Canalizaciones (automatización de flujos de trabajo de ciencia de datos de un extremo a otro)

Comparación con instancias de proceso de Azure Machine Learning

Las instancias de Proceso de Azure Machine Learning son una imagen de máquina virtual totalmente configurada y administrada, mientras que DSVM es una máquina virtual no administrada.

Diferencias clave entre estas:

Característica Ciencia de datos
máquina virtual
Azure Machine Learning
Instancia de proceso
Totalmente administrada No
Compatibilidad con idiomas Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python y R
Sistema operativo Ubuntu
Windows
Ubuntu
Opción de GPU preconfigurada
Opción de escalado vertical
Acceso SSH
Acceso RDP No
Integrada
Notebooks hospedados
No
(requiere configuración adicional)
SSO integrado No
(requiere configuración adicional)
Colaboración integrada No
Herramientas preinstaladas Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Casos de uso de ejemplo

A continuación, se muestran algunos casos de uso comunes para los clientes de DSVM.

Evaluación y experimentación a corto plazo

Puede usar DSVM para evaluar o aprender sobre las nuevas herramientas de ciencia de datos, especialmente en algunos de nuestros ejemplos y tutoriales publicados.

Aprendizaje profundo con GPU

En Data Science Virtual Machine, los modelos de entrenamiento pueden usar algoritmos de aprendizaje profundo en hardware basado en unidades de procesamiento de gráficos (GPU). Aprovechando las funcionalidades de escalado de máquinas virtuales de la plataforma Azure, DSVM le ayuda a usar hardware basado en GPU en la nube según sus necesidades. Puede cambiar a una máquina virtual basada en GPU cuando vaya a entrenar modelos grandes o cuando necesite cálculos a alta velocidad y desee mantener el mismo disco del SO. Puede elegir cualquiera de las SKU de máquina virtual habilitada para GPU de la serie N con DSVM. Tenga en cuenta que las cuentas gratuitas de Azure no admiten las SKU de máquinas virtuales habilitadas para GPU.

Las ediciones de Windows de DSVM vienen preinstaladas con controladores de GPU, marcos y versiones de GPU de los marcos de aprendizaje profundo. En las ediciones de Linux, el aprendizaje profundo en las GPU está habilitado en las DSVM con Ubuntu.

También puede implementar las ediciones de Ubuntu o Windows de DSVM en una máquina virtual de Azure no basada en las GPU. En este caso, todos los marcos de aprendizaje profundo se revierten al modo CPU.

Más información sobre los marcos de aprendizaje profundo y de inteligencia artificial.

Educación y formación de ciencia de datos

Los instructores y educadores que imparten clases de ciencia de datos proporcionan normalmente una imagen de máquina virtual. La imagen garantiza que los alumnos tienen una configuración coherente y que los ejemplos funcionan según lo previsto.

Data Science Virtual Machine crea un entorno a petición con una configuración coherente que simplifica los desafíos de incompatibilidad y soporte técnico. En los casos en donde estos entornos tienen que crearse con frecuencia, especialmente para las clases de aprendizaje más cortas, estos entornos se benefician sustancialmente.

¿Qué incluye DSVM?

Consulte aquí una lista completa de herramientas en las DSVM con Windows y Linux.

Pasos siguientes

Obtenga más información en estos artículos: