Creación de una instancia de Data Science Virtual Machine

Completado

Activación del espacio aislado de Azure

Use el botón Activar espacio aislado de este módulo para activar el espacio aislado de Learn. Con la activación se creará un grupo de recursos de Azure, un contenedor para los recursos relacionados con un solo dominio de proyecto. Este grupo de recursos estará disponible durante una hora. Use el grupo de recursos para crear una instancia de Data Science Virtual Machine, conectarse a ella y ejecutar programas.

Creación de una instancia de Data Science Virtual Machine

Una vez que haya decidido usar una instancia de Azure Data Science Virtual Machine (DSVM) para explorar su dominio, deberá decidir si prefiere Windows Server 2019 o Ubuntu Server 20.04 LTS como sistema operativo. También debe planear los recursos de hardware y de red que la instancia de DSVM necesita.

Opciones del sistema operativo

Hay dos imágenes de DSVM:

  • Windows Server 2019
  • Ubuntu Server 20.04 LTS

Ambas imágenes contienen varias herramientas para la ciencia de datos y el aprendizaje profundo. Los programadores de Python pueden usar Visual Studio Code o PyCharm para programar PyTorch, TensorFlow y ONNX. Los usuarios de R pueden usar CRAN-R. Los usuarios de C#, TypeScript y F# pueden usar Visual Studio Code. En la imagen de Windows, pueden usar Visual Studio para programar ML.NET y SQL Server para almacenar y recuperar sus datos.

Jupyter se instala en ambos equipos con varios kernels de idioma. En la imagen de Ubuntu, se instala JupyterHub para proporcionar un acceso multiusuario.

Opciones de procesador, RAM y disco

Las máquinas virtuales de Azure se proporcionan con varios tamaños, que se agrupan por tipo:

Tipo Características
Uso general Uso equilibrado de la CPU en proporción de memoria.
GPU Una o varias GPU. Mejor opción para la inferencia y el entrenamiento de aprendizaje automático estadísticos.
Memoria optimizada Memoria alta en proporción de CPU. Buena para el análisis en memoria.
Almacenamiento optimizado Alto rendimiento de disco y E/S. Bueno para los macrodatos.
Informática de alto rendimiento Máquinas con CPU eficaces. Buena para herramientas sin compatibilidad con GPU.
Proceso optimizado Uso elevado de la CPU en proporción de memoria. Probablemente no sea una buena opción para la ciencia de datos. Son preferibles los tipos GPU o informática de alto rendimiento.

Para aprovechar el procesamiento de GPU disponible, las instancias de DSVM están preconfiguradas con los controladores, las versiones de biblioteca y las configuraciones.

Dentro de un tipo, las máquinas normalmente se asocian a una serie basada en letras. Por ejemplo, los tamaños de GPU normalmente comienzan por "N": NC6, NC12s v3, NC24, NV12, etc.

Antes de crear una instancia de DSVM, debe decidirse por una estrategia de almacenamiento. El sistema operativo se puede instalar en un SSD Premium, un SSD estándar o un HDD estándar. Además, puede crear o conectar uno o más discos de datos. Una vez más, puede elegir la tecnología de unidad de disco duro, compensando la mayor velocidad de los SSD frente a su costo por gigabyte.

Puede cambiar el tamaño de la instancia de DSVM si cambian los requisitos. Por ejemplo, puede elegir un tamaño de uso general u optimizado para memoria cuando el enfoque principal sea la adquisición y la comprensión de los datos. Cuando el modelado se convierta en un cuello de botella, podrá cambiar el tamaño a una oferta de GPU.