Exemples d’entraînement de modèle
Cette section comprend des exemples illustrant comment former des modèles d’apprentissage automatique sur Azure Databricks à l’aide de nombreuses bibliothèques open source populaires.
Vous pouvez également utiliser AutoML, qui prépare automatiquement un jeu de données pour l’entraînement des modèles, effectue un ensemble d’essais à l’aide de bibliothèques open source, telles que scikit-learn et XGBoost, et crée un notebook Python avec le code source pour chaque exécution d’essai afin que vous puissiez examiner, reproduire et modifier le code.
Pour obtenir un exemple de bloc-notes montrant comment entraîner un modèle d'apprentissage automatique qui utilise des données dans Unity Catalog et réécrire des prédictions dans Unity Catalog, consultez Entraîner et enregistrer des modèles d'apprentissage automatique avec Unity Catalog.
Exemples de machine learning
Package | Notebook(s) | Fonctionnalités |
---|---|---|
scikit-learn | Didacticiel de Machine Learning | Modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow |
scikit-learn | Exemple de bout en bout | Modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow, XGBoost, registre de modèles, utilisation de modèles |
MLlib | Exemples de MLlib | Classification binaire, arbres de décision, régression GBT, Structured Streaming, transformateur personnalisé |
xgboost | Exemples de XGBoost | Python, PySpark et Scala, charges de travail mononœuds et entraînement distribué |
Exemple de réglage des hyperparamètres
Pour obtenir des informations générales sur le réglage des hyperparamètres dans Azure Databricks, consultez Réglage des hyperparamètres.
Package | Notebook | Fonctionnalités |
---|---|---|
Hyperopt | Hyperopt distribué | Hyperopt distribué, scikit-learn, MLflow |
Hyperopt | Comparer des modèles | Utiliser l’hyperopt distribué pour rechercher simultanément l’espace des hyperparamètres de différents types de modèles |
Hyperopt | Algorithmes d’entraînement distribué et hyperopt | Hyperopt, MLlib |
Hyperopt | Bonnes pratiques pour Hyperopt | Bonnes pratiques pour les jeux de données de différentes tailles |