Bearbeiten

Erstellen eines inhaltsbasierten Empfehlungssystems

Azure Databricks
Azure Machine Learning

Lösungsmöglichkeiten

Dieser Artikel ist ein Lösungsvorschlag. Wenn Sie möchten, dass wir diesen Artikel um weitere Informationen ergänzen, z. B. potenzielle Anwendungsfälle, alternative Dienste, Überlegungen zur Implementierung oder Preisempfehlungen, lassen Sie es uns über Feedback auf GitHub wissen.

Empfehlungen sind für viele Unternehmen von wesentlicher Bedeutung für den Umsatz und werden in verschiedenen Branchen wie Einzelhandel, Nachrichten und Medien genutzt. Aufgrund der Verfügbarkeit großer Datenmengen zur Kundenaktivität können Sie hochrelevante Empfehlungen auf der Basis von Machine Learning geben.

Aufbau

Architectural diagram that shows training, evaluation, and development of a machine learning model for content-based personalization that uses Azure Databricks.

Laden Sie eine PowerPoint-Datei zu dieser Architektur herunter.

Datenfluss

  1. Store herunter. Azure Data Lake Storage speichert große Mengen von Daten über das Verhalten von Benutzern und Konsumenten.

  2. Lesen. Azure Databricks stellt eine Verbindung mit Azure Data Lake Storage her und liest daraus. Die Erfassung in Databricks ermöglicht die Vorverarbeitung und das Training zur Registrierung des Modells.

  3. Vorverarbeitung Bei der Datenvorverarbeitung werden die Daten bereinigt, transformiert und für die Eingabe in das Empfehlungssystemmodell vorbereitet.

  4. Training Das Training umfasst zwei Schritte: Feature Engineering und Modelltraining. Beim Training des Modells verwendet Azure Databricks das vorverarbeitete Dataset, um das Verhalten des besten Empfehlungsmodells zu trainieren und zu erläutern.

  5. Nachbearbeitung Die Nachbearbeitung umfasst die Modellauswertung und -auswahl auf der Grundlage des Modells mit den besten Leistungen.

  6. Bereitstellen der Lösung Azure Databricks verwaltet das Modell. Batch-verwaltete Endpunkte stellen das Modell für die Anzeige auf dem Front-End bereit. Bei der Bereitstellung des Modells ist der Zugriff auf die neuen Daten über neue Endpunkte möglich. Batchempfehlungen und Empfehlungen in Quasi-Echtzeit werden unterstützt.

  7. Schreiben. Benutzeroberflächen, z. B. Webanwendungen, können die gespeicherten Modellergebnisse nutzen. Die Ergebnisse werden in Azure Synapse geschrieben und erfasst. Das Modell wird als Batchrückschluss ausgeführt und speichert die Ergebnisse im jeweiligen Datenspeicher.

Komponenten

Diese Architektur nutzt die folgenden Komponenten:

  • Azure Data Lake Storage umfasst eine Reihe von Speicherfunktionen, die für Big Data-Analysen bestimmt sind und die Dateisystemsemantik, Sicherheit auf Dateiebene und Skalierung bieten.

  • Azure Databricks ist ein verwalteter Apache Spark-Cluster, in dem Modelle trainiert und ausgewertet werden.

  • Azure Synapse Analytics ist das schnelle, flexible und vertrauenswürdige Cloud-Data Warehouse, mit dem Sie elastisch und unabhängig mit einer leistungsstarken Parallelverarbeitungsarchitektur Daten skalieren, berechnen und speichern können.

Szenariodetails

Der in diesem Artikel beschriebene Ansatz konzentriert sich auf die Erstellung eines inhaltsbasierten Empfehlungssystems. Weitere Informationen zu den bewährten Methoden beim Erstellen von Empfehlungssystemen finden Sie in der Dokumentation und den Beispielen für Recommenders auf GitHub.

Dieses Beispielszenario zeigt Ihnen, wie Sie Machine Learning verwenden können, um die inhaltsbasierte Personalisierung für Ihre Kunden zu automatisieren. Die Lösung verwendet Azure Databricks, um ein Modell zu trainieren, das die Wahrscheinlichkeit voraussagt, dass ein Benutzer an einem Artikel interessiert sein wird. Batch-verwaltete Endpunkte stellen das Modell als Vorhersagemodell bereit. Sie können diesen Dienst verwenden, um personalisierte Empfehlungen zu erstellen, indem Sie Artikel auf der Grundlage der Inhalte einstufen, an denen ein Benutzer am ehesten interessiert sein wird.

Mögliche Anwendungsfälle

Diese Lösung eignet sich optimal für den Einzelhandel. Sie ist für folgende Anwendungsfälle relevant:

  • Inhaltsempfehlungen für Websites und mobile Apps
  • Produktempfehlungen für E-Commerce-Websites
  • Empfehlungen für Werbeanzeigen auf Websites

Arten von Empfehlungssystemen

Es gibt drei Haupttypen von Empfehlungssystemen:

  • Kollaborative Filterung Kollaborative Filterung identifiziert ähnliche Muster im Kundenverhalten und empfiehlt Artikel, mit denen andere ähnliche Kunden interagiert haben. Ein Vorteil der kollaborativen Filterung ist die Einfachheit der Datengenerierung – Benutzer erstellen Daten, während sie mit Listen von Artikeln und Produkten interagieren. Außerdem können Kunden neue Artikel und Produkte entdecken, die nicht aus ihren bisherigen Interaktionen zusammengestellt wurden. Der Nachteil der kollaborativen Filterung ist jedoch das Kaltstart-Problem: Da es nur wenige Interaktionen zwischen Benutzern und neuen Angeboten gibt, werden neu hinzugefügte Artikel nicht von einem Algorithmus empfohlen, der ausschließlich auf Kundeninteraktionen beruht.

  • Inhaltsbasiert Die inhaltsbasierte Empfehlung verwendet Informationen über die Artikel, um Kundenpräferenzen zu erfahren, und empfiehlt Artikel, die Eigenschaften mit Artikeln teilen, mit denen ein Kunde zuvor interagiert hat. Inhaltsbasierte Empfehlungssysteme werden durch das Kaltstart-Problem nicht beeinträchtigt und können sich an die Einführung neuer Artikel anpassen. Die Empfehlungen beschränken sich jedoch auf die Features des ursprünglichen Artikels, mit dem ein Kunde interagiert hat.

  • Hybridmethode Ein weiterer Ansatz beim Erstellen von Empfehlungssystemen besteht darin, inhaltsbasierte und kollaborative Filterung zu kombinieren. Dieses System empfiehlt Artikel basierend auf Benutzerbewertungen und Informationen zu Artikeln. Der Hybridansatz hat sowohl die Vorteile der kollaborativen Filterung als auch der inhaltsbasierten Empfehlung.

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautor:

Andere Mitwirkende:

  • Andrew Ajaluwa | Program Manager
  • Gary Moore | Programmierer/Autor

Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.

Nächste Schritte