Ejemplos de entrenamiento de modelos
En esta sección se incluyen ejemplos que muestran cómo entrenar modelos de Machine Learning en Azure Databricks mediante muchas bibliotecas de código abierto conocidas.
También puede usar AutoML, que prepara automáticamente un conjunto de datos para el entrenamiento de modelos, realiza un conjunto de pruebas con bibliotecas de código abierto como scikit-learn y XGBoost, y crea un cuaderno de Python con el código fuente para cada ejecución de prueba para que pueda revisar, reproducir y modificar el código.
Para ver un cuaderno de ejemplo que muestra cómo entrenar un modelo de aprendizaje automático que utiliza datos del Catálogo Unity y escribir predicciones de nuevo en el Catálogo Unity, consulta Entrenar y registrar modelos de aprendizaje automático con el Catálogo Unity.
Ejemplos de aprendizaje automático
Paquete | Cuadernos | Características |
---|---|---|
scikit-learn | Tutorial sobre aprendizaje automático | Modelo de clasificación, MLflow, ajuste automático de hiperparámetros con Hyperopt y MLflow |
scikit-learn | Acceso de un extremo a otro | Modelo de clasificación, MLflow, ajuste automático de hiperparámetros con Hyperopt y MLflow, XGBoost, registro de modelos, servicio de modelos |
MLlib | Ejemplos de MLlib | Clasificación binaria, árboles de decisión, regresión de GBT, Structured Streaming, transformador personalizado |
xgboost | Ejemplos de XGBoost | Python, PySpark y Scala, cargas de trabajo de un solo nodo y entrenamiento distribuido |
Ejemplo de ajuste de hiperparámetros
Para obtener información general sobre el ajuste de hiperparámetros en Azure Databricks, consulte Ajuste de hiperparámetros.
Paquete | Notebook | Características |
---|---|---|
Hyperopt | Hyperopt distribuido | Hyperopt distribuido, scikit-learn, MLflow |
Hyperopt | Comparación de modelos | Use Hyperopt distribuido para buscar espacio de hiperparámetros para diferentes tipos de modelo simultáneamente |
Hyperopt | Algoritmos de entrenamiento distribuido e Hyperopt | Hyperopt, MLlib |
Hyperopt | Procedimientos recomendados de Hyperopt | Procedimientos recomendados para conjuntos de datos de diferentes tamaños |