¿Qué es Azure Data Science Virtual Machine de Azure para Linux y Windows?
Data Science Virtual Machine (DSVM) es una imagen de máquina virtual personalizada disponible en la plataforma en la nube de Azure y puede controlar la ciencia de datos. Tiene muchas herramientas de ciencias de datos populares preinstaladas y preconfiguradas para impulsar la creación de aplicaciones inteligentes para análisis avanzado.
El DSVM está disponible en:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
Además, ofrecemos Azure DSVM para PyTorch: una imagen de Ubuntu 20.04 de Azure Marketplace optimizada para cargas de trabajo de aprendizaje profundo distribuidas de gran tamaño. Esta instancia de DSVM preinstalada viene validada con la versión más reciente de PyTorch, para reducir los costos de instalación y acelerar el tiempo de valor. Viene empaquetado con varias características de optimización:
- ONNX Runtime
- DeepSpeed
- MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- Una pila actualizada con las versiones más recientes compatibles de Ubuntu, Python, PyTorch y CUDA
DSVM es una imagen de máquina virtual personalizada para la ciencia de datos, pero Azure Machine Learning es una plataforma de un extremo a otro que abarca:
- Proceso totalmente administrado
- Compute Instances (Instancias de proceso)
- Clústeres de proceso para tareas distribuidas de aprendizaje automático
- Clústeres de inferencia para puntuaciones en tiempo real
- Almacenes de datos (por ejemplo, Blob, ADLS Gen2, base de datos SQL)
- Seguimiento de experimentos
- Administración de modelos
- Cuaderno
- Entornos (administración de las dependencias de Conda y R)
- Etiquetado
- Canalizaciones (automatización de flujos de trabajo de ciencia de datos de un extremo a otro)
Las Instancias de Proceso de Azure Machine Learning son una imagen de máquina virtual totalmente configurada y administrada, mientras que DSVM es una máquina virtual no administrada.
Diferencias clave entre una instancia de proceso de DSVM y una instancia de proceso de Azure Machine Learning:
Característica | Ciencia de datos máquina virtual |
Azure Machine Learning Instancia de proceso |
---|---|---|
Totalmente administrada | No | Sí |
Compatibilidad con idiomas | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Python y R |
Sistema operativo | Ubuntu Windows |
Ubuntu |
Opción de GPU preconfigurada | Sí | Sí |
Opción de escalado vertical | Sí | Sí |
Acceso SSH | Sí | Sí |
Acceso RDP | Sí | No |
Integrada Notebooks hospedados |
No (requiere configuración adicional) |
Sí |
SSO integrado | No (requiere configuración adicional) |
Sí |
Colaboración integrada | No | Sí |
Herramientas preinstaladas | Jupyter(lab), VS Code, Visual Studio, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter(lab) |
DSVM puede evaluar o aprender nuevas herramientas de ciencia de datos. Pruebe algunos de nuestros ejemplos de publicados y tutoriales.
En DSVM, los modelos de entrenamiento pueden usar algoritmos de aprendizaje profundo en hardware basado en unidades de procesamiento de gráficos (GPU). Si aprovecha las funcionalidades de escalado de máquinas virtuales de la plataforma Azure, DSVM le ayuda a reducir el hardware basado en GPU en la nube, según sus necesidades. Puede cambiar a una máquina virtual basada en GPU al entrenar modelos grandes o cuando necesite cálculos de alta velocidad mientras mantiene el mismo disco del sistema operativo. Puede elegir cualquiera de las SKU de máquina virtual habilitadas para GPU de la serie N con DSVM. Las cuentas gratuitas de Azure no admiten las SKU de máquinas virtuales habilitadas para GPU.
Una edición de DSVM para Windows viene preinstalada con controladores, marcos de GPU y versiones de GPU de marcos de aprendizaje profundo. En las ediciones de Linux, el aprendizaje profundo en las GPU está habilitado en las DSVM con Ubuntu.
También puede implementar las ediciones DSVM de Ubuntu o Windows en una máquina virtual de Azure que no se basa en GPU. En este caso, todos los marcos de aprendizaje profundo vuelven al modo de CPU.
Más información sobre los marcos de aprendizaje profundo y de inteligencia artificial.
Los instructores y educadores que imparten clases de ciencia de datos proporcionan normalmente una imagen de máquina virtual. La imagen garantiza que los alumnos tengan una configuración coherente y que las muestras funcionen de forma predecible.
DSVM crea un entorno a petición con una configuración coherente para facilitar los desafíos de compatibilidad e incompatibilidad. En los casos en donde estos entornos tienen que crearse con frecuencia, especialmente para las clases de aprendizaje más cortas, estos entornos se benefician sustancialmente.
Para obtener más información, vea esta lista completa de herramientas en DSVMs de Windows y Linux.
Para obtener más información, visite estos recursos: