Share via


Veelgestelde vragen over modellering voor Intelligent Recommendations

Dit artikel gaat dieper in op de typen modelleringsalgoritmen die de Intelligent Recommendations-service gebruikt en biedt antwoorden op veelvoorkomende modelleringsvragen.

Inhoud

Overzicht van algoritmen voor Intelligent Recommendations

Het onderdeel Modellering van Intelligent Recommendations gebruikt een aantal verschillende algoritmen om gerangschikte lijsten te maken. De Lijst-API reageert op vragen en retourneert resultaten, afhankelijk van het type algoritme dat is geselecteerd voor modellering. Meer informatie over de typen algoritmen die door de Intelligent Recommendations-service worden gebruikt, vindt u in de volgende tabel:

[!Opmerking]

Gebruik als best practice Experimenten om de resultaten van een paar verschillende lijsttypen en/of gegevenstypen te vergelijken voordat u een definitieve keuze maakt over welk algoritme het beste is voor uw zakelijk gebruiksscenario en uw gegevensset (wat zowel een combinatie van de gegevenstypen als het daadwerkelijke gedrag is).

Type algoritme Omschrijving
Matrixfactorisatie (MF) Matrixfactorisatie is een type collaboratief filteralgoritme dat zich richt op het creëren van relaties van gebruiker ten aanzien van artikel en van artikel ten aanzien van artikel op basis van specifieke gebruikersinteracties (aankoop, gebruik, doorklikken, weergaven, downloaden, enzovoort). Dit type algoritme rangschikt lijsten op basis van de historische voorkeuren van een specifieke gebruiker, wat we op persoonlijke "smaak" gebaseerde rangschikking noemen. Ook worden overeenkomsten tussen items afgeleid op basis van interacties van gebruikers met items.

Matrixfactorisatie genereert symmetrische (als 'A' vergelijkbaar is met 'B', dan is 'B' ook vergelijkbaar met 'A') en transitieve (als 'A' vergelijkbaar is met 'B' en 'B' vergelijkbaar is met 'C', dan is 'A' vergelijkbaar met 'C') rangschikkingen. Gebruik voor de beste resultaten het algoritmetype Matrixfactorisatie bij gebruik van een gegevensset met substantiële interactiesignalen en catalogusmetagegevens. Deze functie is zeer geschikt voor entertainmentdomeinen zoals films en tv, gaming of streaming, maar werkt ook goed in andere domeinen die afhankelijk zijn van signalen van klantinteractie, waaronder detailhandel, supermarkten, reisroutes, productie en meer.
Direct Associated Similarities (DAS) Het algoritme Direct Associated Similarities (DAS) is zeer geschikt voor lokale/gerichte affiniteitsdomeinen met hoge op hulpprogramma's gebaseerde behoeften, zoals apps waarbij bruikbaarheid belangrijker is dan historische voorkeur (smaak). Personen die bijvoorbeeld actie 'A', dan actie 'B' en dan actie 'C' uitvoeren, hebben de neiging om daarna actie 'D' uit te voeren. DAS is niet-symmetrisch en niet-associatief.

Onze service gebruikt het DAS-algoritme om de API De beste vervolgactie aan te sturen waarmee inhoudssuggesties worden gemaakt op basis van verschillende, herhaalbare groeperingen. Een veelgebruikte toepassing van De beste vervolgactie is vaak te zien bij het afrekenen in winkels in scenario's voor "Aanvulling van winkelwagens", zoals Vaak samen gekocht, waarbij aanvullende itemsuggesties worden gegeven op basis van de inhoud van de winkelwagen van een gebruiker.

DAS kan ook groepen opnieuw combineren en artikelen uit verschillende subdomeinen aanbevelen. Een klant van een supermarkt kan bijvoorbeeld servetten en borden bij hun hamburgers en broodjes in hun winkelwagen krijgen aanbevolen.

Domeinen die gebruikmaken van "De beste vervolgactie" zijn onder meer supermarkten, verkoop, probleemoplossing, boekhouding en meer.
Visual-Based Similarity (VBS) Visual-Based Similarity (VBS) is een Deep Learning-algoritme voor visuele herkenning dat visueel vergelijkbare aanbevelingen retourneert voor artikelen met vergelijkbare afbeeldingen voor een bepaald seed-artikel. Net als Matrixfactorisatie zijn de door het VBS-algoritme geproduceerde aanbevelingen symmetrisch.

Dit Deep Learning, convolutief neuraal netwerk gebruikt 'Argus' als basis, maar het is verder getraind met behulp van diepere technieken op de afbeeldingen van de tenant voor weergave-invarianten, waardoor veel relevantere aanbevelingen worden gedaan voor het domein van de tenant. VBS is ongelooflijk krachtig in domeinen als mode, ontwerp en sieraden, waarbij visuele kenmerken een belangrijk verkooponderdeel van het product zijn.
Text-Based Similarity (TBS) Het algoritme Text Based Similarity (TBS) retourneert tekstueel vergelijkbare aanbevelingen voor een bepaald seed-artikel door een taalmodel gericht te trainen op de titels en beschrijvingen van de artikelen in de aangeboden catalogus. Dit algoritme werkt vooral goed in domeinen waarin titels en beschrijvingen beschrijvend zijn en unieke en intuïtieve aanbevelingen opleveren. Het model gebruikt het 'TNLR' Transformer-gebaseerd taalmodel als basis, maar het model gebruikt ook de methoden Transfer Learning en Deeper Training op de geleverde gegevensset, waardoor dit algoritme state-of-the-art aanbevelingen kan doen die semantisch logisch zijn.

TBS gebruikt Natural Language Processing (NLP) als invoer waardoor dit algoritme toepasbaar is in veel verschillende domeinen, waaronder: reisroutes en excursies, wijnmakerijen, onderzoeksdatabases voor wetenschappelijke tijdschriften, probleemoplossing en meer.
Bladerlijsten Met bladerlijsten kunt u door een catalogus bladeren met behulp van heuristische grafieken die zijn gesorteerd op informatie zoals totale verkopen, som van klikacties, releasedatum of een combinatie van verschillende metrische gegevens. Ondersteunde lijsten zijn: 'Nieuw', 'Trending', 'Populair'. Grafieken zijn een prima startpunt om eindgebruikers snel te laten communiceren met uw producten en het nieuwste en beste van uw productcatalogus te zien.

Bladerlijsten kunnen verder worden uitgebreid door het invoerinteractietype te wijzigen. Een model dat is gebaseerd op aankoopsignalen retourneert bijvoorbeeld "meest populaire gekochte producten", terwijl de modelsignalen voor weergaven "Meest bekeken producten" retourneren.

Terug naar boven

Veelgestelde vragen

In dit gedeelte wordt een reeks vragen behandeld die vaak worden gesteld over Intelligent Recommendations-modellen en de toepassingen ervan.

Hoe kan ik de modelleringsstatus volgen?

Klanten van Intelligent Recommendations kunnen de modelleringsstatus volgen voor elk van de modellen die ze op hun account hebben gemaakt. Na het configureren van een model maakt de service periodiek een statuslogboekbestand om te rapporteren over de huidige status van alle algoritmen (met betrekking tot uw modelleringslaag). Zie voor meer informatie over toegang tot deze logboeken Handleiding voor rapporten over modelleringsstatus.

Terug naar boven

Welk algoritme en welk lijsttype moet ik kiezen voor mijn bedrijf?

Welk lijsttype en algoritme u moet selecteren, hangt af van het zakelijke gebruiksscenario, ervaring en gegevens die beschikbaar zijn voor modellering. Zie Lijstnamen, AlgoTypes-tabel, verfijningen voor een volledige lijst met beschikbare lijstnamen en AlgoType-combinaties.

Over het algemeen weerspiegelen modelleringsinteracties de interacties van mensen. We beschrijven bijvoorbeeld het lijsttype 'Wat anderen ook', dat het MF-algoritme gebruikt als 'klanten die deze actie uitvoeren, voeren ook deze actie uit'. Wanneer de actie kopen is, wordt de lijst "Mensen die dit kochten, kochten ook".

Metagegevens van artikelen kunnen ook worden gebruikt om overeenkomsten tussen artikelen vast te stellen, ervan uitgaande dat de metagegevens voldoende in volume en kwaliteit zijn. Artikelen met vergelijkbare beschrijvingen kunnen bijvoorbeeld worden beschouwd als nauw verwant, zoals ook artikelen met vergelijkbare productafbeeldingen nauw verwant kunnen zijn. Deze metagegevens zijn nuttig geweest om resultaten te creëren voor items wanneer er mogelijk geen interacties beschikbaar zijn (ook wel modellering van "koude items" genoemd).

Benaderingen die interacties en metagegevens combineren (voor artikelen en/of gebruikers), kunnen worden gebruikt met Intelligent Recommendations om de scenario's en ervaringen aan te passen. Gebruik meerdere verschillende modellen (en gebruik één model per account) om te experimenteren en te zien welke benadering het beste werkt voor uw gebruiksscenario´s.

Beschikbare gegevenstypen en gebruiksscenario´s toewijzen aan algoritmetype

Beschikbaar gegevenstype Scenario's Algoritme
Interacties
Bijvoorbeeld weergaven, aankopen, gebruik enzovoort Wat deden gebruikers?
Selectie voor u
Personalisatie
Wat anderen ook doen
De beste vervolgactie
Matrixfactorisatie (MF)

Direct Associated Similarities (DAS)
Tekstuele metagegevens
Bijvoorbeeld Titel, Beschrijving
Vergelijkbare beschrijving Textual Based Similarity (TBS)
Visuele metagegevens
Bijvoorbeeld productafbeeldingen vanuit meerdere hoeken
Vergelijkbare looks
Opmerking: niet alle domeinen passen in dit scenario. U moet het gebruiken in het geval waarin afbeeldingen een goede weergave zijn van een artikel.
Visual-Based Similarity (VBS)
Overige metagegevens van artikelen
Bijvoorbeeld Vorm, Categorie, Tags enzovoort
Hetzelfde als Interacties.
Met de service kunnen modellen ook op verschillende manieren worden gebouwd:
- Op een hybride manier metagegevens van artikelen combineren met interacties
- Of gebouwd met alleen metagegevens van artikelen (met MF- of DAS-algoritmen)
Matrixfactorisatie (MF)

Direct Associated Similarities (DAS)
Metagegevens van gebruikers
Bijvoorbeeld demografische gegevens
Relevante scenario's betreffen persoonlijke instellingen van gebruikers:
- Selecties voor u
- Persoonlijke instellingen

Met de service kunnen modellen op verschillende manieren worden gebouwd:
- Op een hybride manier waarbij metagegevens van gebruikers met interacties worden gecombineerd
- Of gebouwd met alleen metagegevens van gebruikers (met MF- of DAS-algoritmen)
Matrixfactorisatie (MF)

Direct Associated Similarities (DAS)

Terug naar boven

Hoe moet ik beslissen of ik de Matrixfactorisatie- of Directe associatie-algoritmen wil gebruiken?

Het wordt aanbevolen om beide met uw gegevens te proberen om te zien welk algoritme geschiktere resultaten oplevert op basis van uw zakelijke vereisten.

Probeer het MF-algoritme (Matrixfactorisatie) in de volgende gevallen:

  • Als de verbinding tussen artikelen in uw domein meestal commutatief is (symmetrisch, d.w.z. als A=>B dan B=>A) en associatief (d.w.z. als A=>B en B=>C dan A=>B).
  • Als uw gegevens schaars zijn en u nog steeds voldoende aanbevelingen voor veel artikelen wilt.

Probeer het DAS-algoritme (Directe associatie) in de volgende gevallen:

  • Als de verbinding tussen artikelen in uw domein meestal directief is (asymmetrisch, d.w.z. A=>B betekent niet B=>A) en direct (niet associatief).
  • Als 'De beste vervolgactie' (wat zou op basis van geordende lijst met artikelen de volgende moeten zijn) een belangrijk scenario voor u is.
  • Als u het ene subdomein van uw artikelen wilt aanbevelen aan een ander subdomein.
  • Directe verbinding die meer lijkt, moet meer worden weerspiegeld in de resultaten.

Zie Lijstnamen, AlgoType-tabellen, verfijningen voor meer informatie.

Terug naar boven

Hoeveel interacties heb ik nodig om goede aanbevelingen te krijgen?

Om een domein correct te modelleren voor een reeks belangrijke producten, moet elk product ten minste vijf of meer interacties bevatten voor scenario's als "Wat anderen ook leuk vinden" of "Selecties" (personalisatie). U hebt ook voldoende interacties nodig die meer dan één product bevatten, dat is gegroepeerd op de InteractionGroupingId (elk artikel in dezelfde volgorde moet een rij hebben in de gegevensentiteit Interacties met dezelfde InteractionGroupingId) om resultaten te genereren voor "De beste vervolgactie".

Een goede vuistregel is om te streven naar ongeveer vijf keer het aantal interacties als het aantal artikelen. Als er bijvoorbeeld 1000 artikelen in de catalogus staan, is het aan te raden om te proberen met ten minste 5000 interacties te modelleren.

Bij twijfel helpt het om het uit te proberen met een eenvoudig model (minder kolommen) en zoveel mogelijk interacties (meer rijen) in de invoergegevensset. Raadpleeg Intelligent Recommendations-dashboards om de kwaliteit van uw gegevenscontract te evalueren en metrische gegevens over modelprestaties te zien.

Terug naar boven

Waarom heb ik InteractionsGroupingId, UserId, ItemId en ItemVariantId nodig bij mijn gegevensentiteit voor interacties?

InteractionGroupingId geeft een indicatie voor de door het systeem verbonden groepen, vooral voor artikelen, voor betere algemene interferentie over de hele linie. Het groeperen van transacties op InteractionGroupingId in het detailhandelsscenario kan het systeem bijvoorbeeld helpen om te leren welke producten "Vaak samen worden gekocht" in een winkelwagentje, of taken die worden voltooid in een rol voor "De beste vervolgactie", of vergelijkbare artikelen in "Wat anderen ook leuk vinden".

UserId wordt door het systeem gebruikt om de relaties te modelleren die wordt gevormd tussen items en gebruikers die interacties hebben met items, die, afhankelijk van hoe het model is gefocust, zowel gepersonaliseerde als niet-gepersonaliseerde modelleringsscenario's kunnen creëren. In de gepersonaliseerde benadering met UserId modelleert het systeem een toewijzing tussen gebruikers en artikelen, gebaseerd op de historische voorkeuren van elke individuele gebruiker. Vervolgens wordt het model "gebaseerd op uw eerdere geschiedenis van wat u misschien leuk vindt" geproduceerd, ook wel "Selecties voor u" genoemd.

ItemId is de werkelijke artikelverwijzing. Het is essentieel om elk artikel te verbinden met de interacties ervan en de patronen in het model naar voren te laten komen. ItemIds die geen interacties hebben, verschijnen niet in aanbevelingen voor andere producten en kunnen ook last hebben van slechte aanbevelingen wanneer ze worden gebruikt als startpunt voor modellen als "Anderen die dit artikel leuk vinden, vinden dit ook leuk".

ItemVariantId wordt voornamelijk gebruikt voor het scenario "Vergelijkbare looks" en het VBS-algoritme (Visual Based Similarity) dat rekening houdt met metagegevens van afbeeldingen in plaats van interacties. Dit veld is niet vereist voor modellen en algoritmen die gebaseerd zijn op interacties.

Zie voor meer informatie over de vereiste gegevensentiteiten per scenario Toewijzingstabel voor gegevensentiteiten.

Terug naar boven

Kan ik metagegevens van artikelen zoals categorie, kleur, model enzovoort gebruiken?

Metagegevens van artikelen kunnen op veel manieren nuttig zijn:

  • Betere modellering van artikelen naast de invoer van interacties, dus artikelen met weinig of zelfs geen interacties (koude artikelen) kunnen nog steeds aanbevelingen in de vorm van "Wat anderen ook leuk vinden" krijgen.
  • Het is mogelijk om een model te hebben dat volledig is gebaseerd op metagegevens van artikelen (zoals inhoudstags) en een aanbevelingsresultaat van het type "vergelijkbare items" te retourneren.
    • Hoe u dit doet: geef het metagegevensartikel een TagId. Stel in de gegevensentiteit voor interacties voor elke interactierij de InteractionGroupingId in als de TagId, terwijl u het artikel behoudt als ItemId en de gebruiker als UserID. Zie voor meer informatie over hoe TagIds werken gids voor taggen en bucketing van metagegevens.

[!BELANGRIJKE OPMERKING]

Gebruik een afzonderlijk account voor het op metagegevens van artikelen gebaseerde model, zodat u 1 IR-model per IR-account hebt. Deze staan los van het pure op gebruikersinteracties gebaseerde model/account.

  • Artikelen met informatieve tekstuele beschrijvingen kunnen 'Vergelijkbare beschrijving'-aanbevelingen krijgen, aangestuurd door ons diepe NLP-model.
  • Artikelen en varianten met afbeeldingen kunnen “Vergelijkbare look"-aanbevelingen krijgen, aangestuurd door ons Deep Learning-model voor visuele herkenning.

Terug naar boven.

Kan ik metagegevens van gebruikers, zoals demografische gegevens, gebruiken om aanbevelingen te personaliseren?

Met de Intelligent Recommendations-service kunnen klanten metagegevens van gebruikers opnemen via een proces van taggen van metagegevens. Metagegevens van gebruikers kunnen krachtig zijn voor het aanbevelen van relevante inhoud aan alle gebruikers, zoals

  • Nieuwe of onregelmatige klanten (ook wel "koude gebruikers" genoemd).
  • Gebruikers met gemeenschappelijke kenmerken verbinden met taggen van metagegevens. Zie voor meer informatie over demografische bucketing met aanbevelingen en om voorbeelden te bekijken gids voor taggen en bucketing van metagegevens.

Terug naar boven.

Kan ik aanbevelingen doen van gebruiker aan gebruiker?

Op dit moment worden volledige aanbevelingen van gebruiker aan gebruiker niet ondersteund. Voor nu is het voor sommige gegevenssets mogelijk om aanbevelingen van gebruiker aan gebruiker te krijgen door enkele wijzigingen aan te brengen in het gegevenscontract:

  • Construeer voor elke oorspronkelijke interactie-invoer elke rij om het volgende te doen:
    • ItemID in de kolom InteractionGroupingId schrijven
    • UserID in de kolom ItemId schrijven
    • De API-aanvraag uitvoeren: nadat u de vorige wijzigingen in het gegevenscontract hebt aangebracht, wordt het lijsttype "Wat anderen ook" aangeroepen met de UserId en wordt een lijst met vergelijkbare gebruikers geretourneerd.

Terug naar boven.

Waar kan ik meer te weten komen over het Matrixfactorisatie-model dat wordt gebruikt bij Intelligent Recommendations?

Ons MF-model: collaboratieve filtering in één klasse met willekeurige grafieken. We hebben een interne versie van Bayesiaanse matrixfactorisatie ontwikkeld, die we hier hebben beschreven. Dit kan worden gebruikt om insluitingen te leren, zoals we hier hebben uitgelegd

Terug naar boven.

Zie ook

Probleemoplossingshandleiding
API-statuscodes
Gegevenscontract
Toewijzingstabel voor gegevensentiteiten.
Gids voor taggen en bucketing van metagegevens.