Exemples d’entraînement de modèle

Cette section inclut des exemples montrant comment entraîner des modèles Machine Learning sur Azure Databricks à l’aide de nombreuses bibliothèques open source populaires.

Vous pouvez également utiliser AutoML, qui prépare automatiquement un jeu de données pour l’entraînement du modèle, effectue un ensemble d’essais à l’aide de bibliothèques open source telles que scikit-learn et XGBoost, et crée un bloc-notes Python avec le code source pour chaque exécution d’évaluation afin de pouvoir passer en revue, reproduire et modifier le code.

Exemples de machine learning

Paquet Ordinateur portable(s) Fonctionnalités
scikit-learn Didacticiel sur le Machine Learning Catalogue Unity, modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow
scikit-learn Exemple de bout en bout Catalogue Unity, modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow, XGBoost
MLlib Exemples de MLlib Classification binaire, arbres de décision, régression GBT, Structured Streaming, transformateur personnalisé
xgboost Exemples de XGBoost Python, PySpark et Scala, charges de travail à nœud unique et entraînement distribué

Exemple de réglage des hyperparamètres

Pour plus d’informations générales sur le réglage des hyperparamètres dans Azure Databricks, consultez Réglage des hyperparamètres.

Note

La version open source de Hyperopt n’est plus conservée.

Hyperopt n’est pas inclus dans Databricks Runtime pour Machine Learning après 16.4 LTS ML. Azure Databricks recommande d’utiliser Optuna pour l’optimisation à nœud unique ou RayTune pour une expérience similaire à la fonctionnalité d’optimisation distribuée d’hyperparamètres hyperopt déconseillée. En savoir plus sur l’utilisation de RayTune sur Azure Databricks.

Paquet Ordinateur portable Fonctionnalités
Optuna Bien démarrer avec Optuna Optuna, Optuna distribué, scikit-learn, MLflow
Hyperopt Hyperopt distribué Hyperopt distribué, scikit-learn, MLflow
Hyperopt Comparer des modèles Utiliser l’hyperopt distribué pour rechercher simultanément l’espace des hyperparamètres de différents types de modèles
Hyperopt Algorithmes d’entraînement distribué et hyperopt Hyperopt, MLlib
Hyperopt Bonnes pratiques pour Hyperopt Bonnes pratiques pour les jeux de données de différentes tailles