Implementación de una solución de Azure Machine Learning con Azure Databricks

Intermedio
Científico de datos
Azure Databricks

Azure Databricks es una plataforma con escalado en la nube para el análisis de datos y el aprendizaje automático. Los científicos de datos y los ingenieros de aprendizaje automático pueden usar Azure Databricks para implementar soluciones de aprendizaje automático a gran escala.

Requisitos previos

En esta ruta de aprendizaje se da por supuesto que tiene experiencia en el uso de Python para explorar datos y entrenar modelos de Machine Learning con marcos de código abierto comunes, como Scikit-Learn, PyTorch y TensorFlow. Considere la posibilidad de completar la ruta de aprendizaje Creación de modelos de Machine Learning antes de iniciar esta.

Módulos en esta ruta de aprendizaje

Azure Databricks es un servicio en la nube que proporciona una plataforma escalable para el análisis de datos mediante Apache Spark.

Azure Databricks se basa en Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.

El aprendizaje automático implica el uso de datos para entrenar un modelo predictivo. Azure Databricks admite varios marcos de aprendizaje automático de uso frecuente que puede usar para entrenar modelos.

MLflow es una plataforma de código abierto para administrar el ciclo de vida de aprendizaje automático que Azure Databricks admite de manera nativa.

El ajuste de hiperparámetros es una parte esencial del aprendizaje automático. En Azure Databricks, puede usar la biblioteca Hyperopt para optimizar los hiperparámetros de manera automática.

AutoML en Azure Databricks simplifica el proceso de creación de un modelo de aprendizaje automático eficaz para sus datos.

El aprendizaje profundo usa redes neuronales para entrenar modelos de aprendizaje automático altamente eficaces para previsiones complejas, Computer Vision, el procesamiento del lenguaje natural y otras cargas de trabajo de IA.