Uso de scikit-learn en Azure Databricks

En esta página se proporcionan ejemplos de cómo puede usar el paquete de scikit-learn para entrenar modelos de aprendizaje automático en Azure Databricks. scikit-learn es una de las bibliotecas de Python más populares para machine learning de un solo nodo y se incluye en Databricks Runtime y Databricks Runtime ML. Consulte Notas de la versión de Databricks Runtime para ver la versión de la biblioteca de scikit-learn que se incluye en el entorno de ejecución del clúster.

Puede importar estos cuadernos y ejecutarlos en el área de trabajo de Azure Databricks.

Para obtener cuadernos de ejemplo adicionales para empezar a trabajar rápidamente con Azure Databricks, consulte Tutoriales: Introducción a ML.

Ejemplo básico con scikit-learn

En este cuaderno se proporciona información general rápida sobre el entrenamiento del modelo de aprendizaje automático en Azure Databricks. Usa el paquete de scikit-learn para entrenar un modelo de clasificación simple. También muestra el uso de MLflow para realizar un seguimiento del proceso de desarrollo del modelo y hyperopt para automatizar el ajuste de hiperparámetros.

Cuaderno de clasificación de Scikit-learn

Obtener el cuaderno

Ejemplo completo con scikit-learn en Azure Databricks

En este cuaderno se utiliza scikit-learn para ilustrar un ejemplo completo para ver cómo cargar datos, entrenar un modelo, ajustar hiperparámetros distribuidos e inferir modelos. También muestra la administración del ciclo de vida del modelo mediante el Registro de modelos de MLflow para registrar y registrar el modelo.

Use scikit-learn con el cuaderno de integración de MLflow

Obtener el cuaderno