Exemples d’entraînement de modèle

Cette section comprend des exemples illustrant comment former des modèles d’apprentissage automatique sur Azure Databricks à l’aide de nombreuses bibliothèques open source populaires.

Vous pouvez également utiliser AutoML, qui prépare automatiquement un jeu de données pour l’entraînement des modèles, effectue un ensemble d’essais à l’aide de bibliothèques open source, telles que scikit-learn et XGBoost, et crée un notebook Python avec le code source pour chaque exécution d’essai afin que vous puissiez examiner, reproduire et modifier le code.

Pour obtenir un exemple de bloc-notes montrant comment entraîner un modèle d'apprentissage automatique qui utilise des données dans Unity Catalog et réécrire des prédictions dans Unity Catalog, consultez Entraîner et enregistrer des modèles d'apprentissage automatique avec Unity Catalog.

Exemples de machine learning

Package Notebook(s) Fonctionnalités
scikit-learn Didacticiel de Machine Learning Modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow
scikit-learn Exemple de bout en bout Modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow, XGBoost, registre de modèles, utilisation de modèles
MLlib Exemples de MLlib Classification binaire, arbres de décision, régression GBT, Structured Streaming, transformateur personnalisé
xgboost Exemples de XGBoost Python, PySpark et Scala, charges de travail mononœuds et entraînement distribué

Exemple de réglage des hyperparamètres

Pour obtenir des informations générales sur le réglage des hyperparamètres dans Azure Databricks, consultez Réglage des hyperparamètres.

Package Notebook Fonctionnalités
Hyperopt Hyperopt distribué Hyperopt distribué, scikit-learn, MLflow
Hyperopt Comparer des modèles Utiliser l’hyperopt distribué pour rechercher simultanément l’espace des hyperparamètres de différents types de modèles
Hyperopt Algorithmes d’entraînement distribué et hyperopt Hyperopt, MLlib
Hyperopt Bonnes pratiques pour Hyperopt Bonnes pratiques pour les jeux de données de différentes tailles