Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette section inclut des exemples montrant comment entraîner des modèles Machine Learning sur Azure Databricks à l’aide de nombreuses bibliothèques open source populaires.
Vous pouvez également utiliser AutoML, qui prépare automatiquement un jeu de données pour l’entraînement du modèle, effectue un ensemble d’essais à l’aide de bibliothèques open source telles que scikit-learn et XGBoost, et crée un bloc-notes Python avec le code source pour chaque exécution d’évaluation afin de pouvoir passer en revue, reproduire et modifier le code.
Exemples de machine learning
| Paquet | Ordinateur portable(s) | Fonctionnalités |
|---|---|---|
| scikit-learn | Didacticiel sur le Machine Learning | Catalogue Unity, modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow |
| scikit-learn | Exemple de bout en bout | Catalogue Unity, modèle de classification, MLflow, réglage automatisé des hyperparamètres avec Hyperopt et MLflow, XGBoost |
| MLlib | Exemples de MLlib | Classification binaire, arbres de décision, régression GBT, Structured Streaming, transformateur personnalisé |
| xgboost | Exemples de XGBoost | Python, PySpark et Scala, charges de travail à nœud unique et entraînement distribué |
Exemple de réglage des hyperparamètres
Pour plus d’informations générales sur le réglage des hyperparamètres dans Azure Databricks, consultez Réglage des hyperparamètres.
Note
La version open source de Hyperopt n’est plus conservée.
Hyperopt n’est pas inclus dans Databricks Runtime pour Machine Learning après 16.4 LTS ML. Azure Databricks recommande d’utiliser Optuna pour l’optimisation à nœud unique ou RayTune pour une expérience similaire à la fonctionnalité d’optimisation distribuée d’hyperparamètres hyperopt déconseillée. En savoir plus sur l’utilisation de RayTune sur Azure Databricks.
| Paquet | Ordinateur portable | Fonctionnalités |
|---|---|---|
| Optuna | Bien démarrer avec Optuna | Optuna, Optuna distribué, scikit-learn, MLflow |
| Hyperopt | Hyperopt distribué | Hyperopt distribué, scikit-learn, MLflow |
| Hyperopt | Comparer des modèles | Utiliser l’hyperopt distribué pour rechercher simultanément l’espace des hyperparamètres de différents types de modèles |
| Hyperopt | Algorithmes d’entraînement distribué et hyperopt | Hyperopt, MLlib |
| Hyperopt | Bonnes pratiques pour Hyperopt | Bonnes pratiques pour les jeux de données de différentes tailles |