Utiliser Apache Spark MLlib dans Azure Databricks

Cette page fournit des exemples de notebooks montrant comment utiliser MLlib sur Azure Databricks.

Apache Spark MLlib est la bibliothèque de machine learning Apache Spark constituée d’utilitaires et d’algorithmes d’entraînement courants, notamment la classification, la régression, le clustering, le filtrage collaboratif, la réduction de la dimensionnalité, et les primitives d’optimisation sous-jacentes. Pour obtenir des informations de référence sur les fonctionnalités MLlib, Azure Databricks recommande de consulter les informations de référence des API Apache Spark suivantes :

Le package pyspark.ml d’Apache Spark MLlib est pris en charge sur des instances de calcul sans serveur, standard et dédié.

Pour obtenir des informations sur l’utilisation d’Apache Spark MLlib à partir de R, consultez la documentation Machine Learning avec R.

Exemple de notebook de classification binaire

Ce notebook vous montre comment créer une application de classification binaire avec l’API Apache Spark MLlib Pipelines.

Notebook de classification binaire

Obtenir un ordinateur portable

Exemples de carnets d’arbres de décision

Ces exemples illustrent différentes applications d’arbres de décision avec l’API Apache Spark MLlib Pipelines.

Arbres de décision

Ces notebooks vous montrent comment effectuer des classifications avec des arbres de décision.

Arbres de décision pour la reconnaissance des chiffres dans un carnet numérique

Obtenir un ordinateur portable

Arbres de décision pour le cahier d'enquête SFO

Obtenir un ordinateur portable

Régression GBT avec des pipelines MLlib

Ce notebook vous montre comment utiliser des pipelines MLlib pour effectuer une régression à l’aide d’arbres avec dégradé avancé et prédire le nombre de locations de vélo (par heure) à partir d’informations telles que le jour de la semaine, la météo, la saison, etc.

Obtenir un ordinateur portable

Exemple de cahier Apache Spark MLlib avancé

Ce notebook illustre la création d’un transformateur personnalisé.

Notebook de transformateur personnalisé

Obtenir un ordinateur portable

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-23

Utiliser Apache Spark MLlib dans Azure Databricks

Exemple de notebook de classification binaire

Notebook de classification binaire

Exemples de carnets d’arbres de décision

Arbres de décision

Arbres de décision pour la reconnaissance des chiffres dans un carnet numérique

Arbres de décision pour le cahier d'enquête SFO

Régression GBT avec des pipelines MLlib

Cahier de régression du partage de vélos

Exemple de cahier Apache Spark MLlib avancé

Notebook de transformateur personnalisé

Commentaires

Ressources supplémentaires