Partekatu bidez


Uso de scikit-learn en Azure Databricks

En esta página se proporcionan ejemplos de cómo puede usar el paquete de scikit-learn para entrenar modelos de aprendizaje automático en Azure Databricks. scikit-learn es una de las bibliotecas de Python más populares para machine learning de un solo nodo y se incluye en Databricks Runtime y Databricks Runtime ML. Consulte Notas de la versión de Databricks Runtime para ver la versión de la biblioteca de scikit-learn que se incluye en el entorno de ejecución del clúster.

Puede importar estos cuadernos y ejecutarlos en el área de trabajo de Azure Databricks.

Ejemplo básico con scikit-learn

En este cuaderno se proporciona información general rápida sobre el entrenamiento del modelo de aprendizaje automático en Azure Databricks. Usa el paquete de scikit-learn para entrenar un modelo de clasificación simple. En el ejemplo también se muestra el uso de MLflow para realizar un seguimiento del proceso de desarrollo del modelo y de Optuna para automatizar el ajuste de hiperparámetros.

Si el área de trabajo está habilitada para Unity Catalog, use esta versión del cuaderno:

Cuaderno de clasificación de scikit-learn (Catálogo Unity)

Obtención del cuaderno

Si el área de trabajo no está habilitada para Unity Catalog, use esta versión del cuaderno:

Cuaderno de clasificación de Scikit-learn

Obtención del cuaderno

Ejemplo completo con scikit-learn en Azure Databricks

En este cuaderno se utiliza scikit-learn para ilustrar un ejemplo completo para ver cómo cargar datos, entrenar un modelo, ajustar hiperparámetros distribuidos e inferir modelos. También muestra la administración del ciclo de vida del modelo mediante el Registro de modelos de MLflow para registrar y registrar el modelo.

Si el área de trabajo está habilitada para Unity Catalog, use esta versión del cuaderno:

Uso de scikit-learn con la integración de MLflow en Databricks (Catálogo de Unity)

Obtención del cuaderno

Si el área de trabajo no está habilitada para Unity Catalog, use esta versión del cuaderno:

Uso de scikit-learn con la integración de MLflow en Databricks

Obtención del cuaderno