Modifier

Créer un système de suggestions basées sur du contenu

Azure Databricks
Azure Machine Learning

Idées de solution

Cet article présente une idée de solution. Si vous souhaitez que nous développions le contenu avec d’autres informations, telles que des cas d’usage potentiels, d’autres services, des considérations d’implémentation ou un guide des prix, adressez-nous vos commentaires GitHub.

Les recommandations constituent une source de revenus clé pour de nombreuses entreprises et sont utilisées dans différents secteurs d’activité, y compris la vente au détail, les actualités et les médias. De grandes quantités de données sur l’activité des clients étant disponibles, vous pouvez fournir des recommandations très pertinentes à l’aide du Machine Learning.

Architecture

Architectural diagram that shows training, evaluation, and development of a machine learning model for content-based personalization that uses Azure Databricks.

Téléchargez un fichier PowerPoint de cette architecture.

Dataflow

  1. Stocker. Azure Data Lake Storage stocke de grandes quantités de données sur le comportement des utilisateurs et des consommateurs.

  2. Lecture. Azure Databricks se connecte à Azure Data Lake Storage et commence à lire les données de cette solution. L’ingestion dans Databricks permet de prétraiter et d’entraîner l’inscription du modèle.

  3. Prétraitement. Le prétraitement des données nettoie, transforme et prépare les données à alimenter le modèle système de recommandations.

  4. Effectuer l’apprentissage. Celui-ci comporte deux étapes : l’ingénierie des caractéristiques et l’entraînement du modèle. Pendant l’entraînement du modèle, Azure Databricks utilise le jeu de données prétraité pour entraîner et expliquer le comportement du meilleur modèle de recommandation.

  5. Post-traitement. Le post-traitement implique l’évaluation et la sélection du modèle en fonction du modèle qui fonctionne le mieux.

  6. Effectuer le déploiement. Azure Databricks gère le modèle. Les points de terminaison gérés par lots déploient le modèle pour l’exposition à l’affichage front-end. À mesure que le modèle est déployé, les nouvelles données sont accessibles via de nouveaux points de terminaison. Les recommandations en temps quasi réel et par lots sont prises en charge.

  7. Écriture. Les interfaces utilisateur, telles que les applications web, peuvent consommer les résultats du modèle stocké. Les résultats sont écrits et capturés dans Azure Synapse. Le modèle s’exécute en tant qu’inférence de lot et stocke les résultats dans le magasin de données approprié.

Components

Cette architecture utilise les composants suivants :

  • Azure Data Lake Storage constitue un ensemble de fonctionnalités de stockage qui sont dédiées à l’analytique Big Data et fournissent la sémantique du système de fichiers, la sécurité au niveau des fichiers et la mise à l’échelle.

  • Azure Databricks est un cluster Apache Spark managé pour l’entraînement et l’évaluation de modèles.

  • Azure Synapse Analytics est un entrepôt de données cloud rapide, flexible et fiable qui vous permet de mettre à l'échelle, de calculer et de stocker de manière élastique et indépendante, avec une architecture de traitement massivement parallèle.

Détails du scénario

L’approche décrite dans cet article est axée sur la génération d’un système de recommandation basée sur le contenu. Pour plus d’informations sur les meilleures pratiques de création de systèmes de recommandation, consultez la documentation et les exemples de personnes ayant effectué une recommandation sur GitHub.

Cet exemple de scénario montre comment vous pouvez utiliser le Machine Learning afin d’automatiser la personnalisation basée sur le contenu pour vos clients. La solution utilise Azure Databricks pour entraîner un modèle qui prédit la probabilité qu’un utilisateur soit intéressé par un élément. Les points de terminaison managés par lots déploient ce modèle en tant que service de prédiction. Vous pouvez utiliser ce service pour créer des recommandations personnalisées en classant les articles en fonction du contenu qui est le plus susceptible d’intéresser un utilisateur.

Cas d’usage potentiels

Cette solution est idéale pour le secteur de la vente au détail. Elle est appropriée pour les cas d’usage suivants :

  • Recommandations de contenu pour les sites web et les applications mobiles
  • Recommandations de produit pour les sites de commerce électronique
  • Affichage des recommandations publicitaires pour les sites web

Types de systèmes de recommandation

Il existe trois types de systèmes de recommandation principaux :

  • Filtrage collaboratif. Le filtrage collaboratif identifie des modèles similaires dans le comportement des clients et recommande les éléments avec lesquels d’autres clients similaires ont interagi. L’un des avantages du filtrage collaboratif réside dans la facilité de génération de données : les utilisateurs créent des données tout en interagissant avec des listes d’éléments et de produits. En outre, les clients peuvent découvrir de nouveaux articles et produits autres que ceux qui sont organisés à partir de leurs interactions historiques. Toutefois, le démarrage à froid est un inconvénient pour le filtrage collaboratif : comme il y a peu d’interactions entre les utilisateurs et les nouvelles offres, les éléments nouvellement ajoutés ne sont pas recommandés par un algorithme qui dépend entièrement des interactions avec les clients.

  • Basé sur le contenu. La recommandation basée sur le contenu utilise les informations propres aux éléments pour apprendre les préférences des clients et recommander les éléments qui partagent des propriétés avec des éléments qu’un client a déjà utilisés. Les systèmes de recommandation basés sur le contenu ne sont pas entravés par le problème de démarrage à froid et peuvent s’adapter à l’introduction de nouveaux éléments. Toutefois, les recommandations sont limitées aux fonctionnalités de l’élément d’origine avec lequel un client a interagi.

  • Méthode hybride. Une autre approche de la création de systèmes de recommandation consiste à fusionner le filtrage basé sur le contenu et collaboratif. Ce système recommande des éléments en fonction des évaluations utilisateur et des informations sur les éléments. L’approche hybride présente les avantages du filtrage collaboratif et de la recommandation basée sur le contenu.

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteur principal :

Autre contributeur :

  • Andrew Ajaluwa | Responsable de programme
  • Gary Moore | Programmeur/rédacteur

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes