Del via


Ofte stillede spørgsmål om modellering af Intelligent Recommendations

Denne artikel indeholder et detaljeret kig på de typer modelleringsalgoritmer, som bruges i tjenesten til Intelligent Recommendations, og den giver svar på almindelige spørgsmål om modellering.

Indhold

Oversigt over algoritmer i Intelligent Recommendations

Modelleringskomponenten til Intelligent Recommendations bruger et par forskellige algoritmer til at oprette rangerede lister. Liste-API'en svarer på forespørgsler og returnerer resultater afhængigt af den type algoritme, der er valgt til modellering. Du kan finde flere oplysninger om de typer algoritmer, der bruges af tjenesten til Intelligent Recommendations, i følgende tabel:

[Bemærk]

Som bedste praksis kan du bruge eksperimenter til at sammenligne resultaterne fra et par forskellige listetyper og/eller datatyper, før du træffer et endelig valg om, hvilken algoritme der er bedst til din virksomheds brugsscenarie og datasæt (som både er en kombination af datatyperne og den faktiske funktionsmåde).

Algoritmetype Beskrivelse
Matrixfaktorisering (MF) Matrixfaktorisering er en form for samarbejdsbaseret filtreringsalgoritme, der fokuserer på at oprette bruger til vare-relationer og vare til vare-relationer baseret på specifikke brugerinteraktioner (køb, brug, klik, visninger, download osv.). Denne algoritmetype rangordner lister baseret på de historiske præferencer for en bestemt bruger, som er det, vi kalder deres personlige "Smag" baserede rangering. Den udleder også ligheder mellem elementer baseret på brugernes interaktion med elementer.

Matrixfaktorisering genererer symmetriske ranglister (hvis "A" svarer til "B", svarer "B" også til "A") og stigende ranglister (hvis "A" svarer til "B", og "B" svarer til "C", så svarer "A" til "C"). Du opnår de bedste resultater ved at bruge matrixfaktoriseringsalgoritmetypen, når du bruger datasæt med væsentlige interaktionssignaler og katalogmetadata. Denne funktion er god til underholdningsdomæner som Film og tv, Spil eller Streaming, men den fungerer også godt i andre domæner, der anvender kundernes interaktionssignaler, herunder: Detail, Dagligvarer, Rejseplaner, Produktion og meget mere.
DAS (Direct Associated Similarities) DAS-algoritmen (Direct Associated Similarities) er velegnet til lokale områder/anviste tilhørsforholdsområder med store brugsbaserede behov, f.eks. apps, hvor brugbarhed er vigtigere end historisk præference (smag). Det kan f.eks. være, at personer, der udfører handlingen "A", derefter "B" og derefter "C", ofte udfører handlingen "D" efterfølgende. DAS er ikke-symmetrisk og ikke-tilknyttet.

Vores tjeneste bruger DAS-algoritmen til at anvende API'en for næste bedste handling, som opretter indholdforslag baseret på separate, gentagelige grupperinger. En almindelig anvendelse af næste bedste handling ses ofte i eksempler med detailkøb i scenarier med "fuldførelse af indkøbsvogn", f.eks. Købes ofte sammen – som indeholder forslag til varer, der komplementerer hinanden, baseret på indholdet af en brugers indkøbsvogn.

DAS kan også sammensætte grupper igen og anbefale varer fra forskellige underdomæner. En kunde i et onlinesupermarked kan f.eks. få anbefalet servietter og tallerkener til burgerbøfferne og -bollerne i kundens indkøbsvogn.

Områder, der har fordel af "Næste bedste handling", omfatter supermarked, salg, fejlfinding, regnskab og flere andre.
VBS (Visual-Based Similarity) Visual-Based Similarity (VBS) er en dybdegående læringsalgoritme med visuel genkendelse, der returnerer visuelt lignende anbefalinger for varer med lignende billeder for et bestemt vare med adgang. På samme måde som matrixfaktorisering er de anbefalinger, der kommer fra VBS-algoritmen, symmetriske.

Dette indviklede neurale netværk med dybdegående læring bruger "Argus" som udgangspunkt, men det trænes yderligere ved hjælp af mere dybdegående teknikker på lejerens billeder med henblik på ensartede visninger, hvilket giver langt mere relevante anbefalinger for lejerens område. VBS er utrolig effektivt inden for områder som mode, design og smykker, hvor visuelle egenskaber udgør en stor del af salget af produktet.
TBS (Text-Based Similarity) TBS-algoritmen (Text-Based Similarity) returnerer tekstmæssigt lignende anbefalinger til en bestemt vare med adgang ved at fokusere på oplæring af en sprogmodel for titlerne og beskrivelserne af varerne i det angivne katalog. Denne algoritme fungerer især godt inden for områder, hvor titler og beskrivelser er beskrivende og giver entydige og intuitive anbefalinger. Modellen bruger "TNLR" – en transformerbaserer sprogmodel som udgangspunkt, men modellen bruger også overførselslæring og dybere oplæringsteknikker på den angivne datasæt, så denne algoritme kan komme med førsteklasses anbefalinger, der semantisk giver mening.

TBS bruger NLP (Natural Language Processing) som input, hvilket gør denne algoritme anvendelig inden for mange forskellige områder, herunder: rejseplaner og udflugter, vingårde, forskningsdatabaser for videnskabelige tidsskrifter, fejlfinding og meget mere.
Gennemse lister Gennemse lister gør det muligt at gennemse kataloger ved hjælp af heuristisk baserede diagrammer, der er sorteret efter oplysninger, f.eks. samlet salg, kliksum, udgivelsesdato eller en kombination af forskellige målepunkter. De understøttede lister er: "Nye", "Tendenser", "Populære". Diagrammer er et godt udgangspunkt for hurtigt at få slutbrugere til at interagere med dine produkter og få vist de nyeste og bedste produkter i dit produktkatalog.

Gennemse lister kan understøttes yderligere ved at ændre inputinteraktionstypen. En model, der er baseret på købssignaler, returnerer f.eks. "De mest populære købte produkter", men hvis modelsignalerne ændres til visninger, returneres "De mest populære viste produkter".

Tilbage til toppen

Ofte stillede spørgsmål

Dette afsnit omhandler en række spørgsmål, der ofte stilles om modeller med Intelligent Recommendations og deres anvendelser.

Hvordan sporer jeg modelleringsstatus for mine modeller?

Kunder med Intelligent Recommendations kan spore modelleringsstatus for hver af de modeller, de har oprettet for deres konto. Når en model er konfigureret, opretter tjenesten jævnligt en statuslogfil for at rapportere om den aktuelle status for alle algoritmer (med hensyn til modelleringsniveauet). Du kan få mere at vide om, hvordan du får adgang til disse logge, i Vejledning til modelleringsstatusrapporter.

Tilbage til toppen

Hvilken algoritme og listetype skal jeg bruge til min virksomhed?

Valget af en listetype og en algoritme, der skal bruges, afhænger af det brugsscenarie, den oplevelse og de data, der er tilgængelige til modellering. Se Tabel med listenavne, AlgoTypes, Forbedringer for at få en komplet liste over tilgængelige listenavne og AlgoType-kombinationer.

Generelt afspejler modelleringsinteraktioner, hvad brugerne kommunikerer med. Vi beskriver f.eks. listetypen "Andre ... også", der bruger MF-algoritmen, som "kunder, der udfører denne handling, udfører også denne handling". Når handlingen er køb, bliver listen "Folk, som købte dette, købte også."

Varemetadata kan også bruges til at etablere ligheder mellem varer, hvor det antages, at metadataene er tilstrækkelige i mængde og kvalitet. Varer med beskrivelser, der minder om hinanden, kan f.eks. betragtes som nært relaterede, ligesom varer med produktbilleder, der minder om hinanden, kan være nært relaterede. Disse metadata var nyttige, da du skulle oprette resultater for varer, hvor der ikke var tilgængelige interaktioner (også kaldet modellering af "kolde varer").

Fremgangsmåder, der kombinerer interaktioner og metadatabaserede (for varer og/eller brugere), kan bruges med Intelligent Recommendations til at tilpasse scenarierne og oplevelserne. Brug flere forskellige modeller (og brug én model pr. konto) til at eksperimentere og se, hvilken fremgangsmåde der fungerer bedst til dine brugsscenarier.

Tilknytte tilgængelige datatyper og brugsscenarier til algoritmetype

Tilgængelig datatype Scenarier Algoritme
Interaktioner
F.eks. visninger, køb, forbrug osv. Hvilke handlinger har brugerne udført?
Udvalgt til dig
Tilpasning
Andre har også
Næste bedste handling
Matrixfaktorisering (MF)

Anvist tilknytning (DAS)
Tekstmetadata
F.eks. titel, Beskrivelse
Lignende beskrivelse Textual Based Similarity (TBS)
Visuelle metadata
F.eks. Produktbilleder fra flere forskellige vinkler
Lignende looks
Bemærk: Ikke alle domæner passer til dette scenarie. Du skal bruge det i tilfælde, hvor billeder er en god repræsentation af en vare.
VBS (Visual-Based Similarity)
Andre varemetadata
F.eks. form, kategori, tags osv.
Det samme som interaktioner.
Tjenesten gør det også muligt at bygge modeller på forskellige måder:
- På en hybrid måde, der kombinerer varemetadata med interaktioner
- Eller bygget udelukkende ved hjælp af varemetadata (med MF- eller DAS-algoritmer)
Matrixfaktorisering (MF)

Anvist tilknytning (DAS)
Brugermetadata
F.eks. demografi
Relevante scenarier er omkring brugertilpasning:
- Udvalgt til dig
- Tilpasning

Tjenesten gør det også muligt at bygge modeller på forskellige måder:
- På en hybrid måde, der kombinerer brugermetadata med interaktioner
- Eller bygget udelukkende ved hjælp af brugermetadata (med MF- eller DAS-algoritmer)
Matrixfaktorisering (MF)

Anvist tilknytning (DAS)

Tilbage til toppen

Hvordan skal jeg beslutte, om jeg vil bruge algoritmerne til matrixfaktorisering eller direkte tilknytning?

Du anbefales at afprøve begge dele med dine data for at se, hvilken algoritme der giver de mest velegnede resultater baseret på dine forretningskrav.

Prøv MF-algoritmen (matrixfaktorisering), hvis:

  • Forbindelsen mellem varer i dit domæne er er overvejende kommutative (symmetrisk, dvs. hvis A=>B, er B=>A) og associative (dvs. hvis A=>B, og B=>C, så er A=>B).
  • Dine data er sparsomme, og du stadig vil have anbefalinger nok til mange varer.

Prøv DAS-algoritmen (Direct Association), hvis:

  • Forbindelsen mellem varer i dit domæne er mest retningsgivende (asymmetrisk, dvs. A=>B betyder ikke, at B=>A) og direkte (ingen association).
  • "Næste bedste handling" (angivet liste over varer i rækkefølge – hvad skal være den næste?) er et vigtigt scenarie for dig.
  • Du vil anbefale ét underdomæne af dine varer til et andet.
  • Direkte forbindelse, der viser, at mere bør afspejles mere i resultaterne.

Flere oplysninger i Tabeller med listenavne, AlgoTypes, Forbedringer.

Tilbage til toppen

Hvor mange interaktioner skal jeg bruge for at sikre gode anbefalinger?

For at modellere et domæne korrekt for et sæt vigtige produkter, skal hvert produkt indeholde mindst fem interaktioner eller derover for scenarier som "Andre synes også godt om" eller "Udvalgte" (tilpasning). Du skal også have tilstrækkelige interaktioner, der omfatter mere end ét produkt, som er grupperet efter InteractionGroupingId (hver vare i samme rækkefølge har en række i interaktionsdataobjektet med det samme InteractionGroupingId), hvis du vil generere resultater for "Næste bedste handling".

En god tommelfingerregel er at have omkring fem gange antallet af interaktioner i forhold til antallet af varer. Hvis der f.eks. findes 1.000 varer i kataloget, kan det være en god ide at afprøve en model med mindst 5.000 interaktioner.

Hvis du er i tvivl, kan du prøve med en simpel model (færre kolonner) og så mange interaktioner (flere rækker) i inputdatasættet som muligt. Hvis du vil evaluere din datakontrakt med henblik på kvalitet og se målepunkter vedrørende modelydeevne, skal du se dashboards til intelligente anbefalinger.

Tilbage til toppen

Hvorfor har jeg brug for, at InteractionGroupingId, UserId, ItemId og ItemVariantId er inkluderet i mit interaktionsdataobjekt?

InteractionGroupingId angives for de systemforbundne grupper – især for varer – for at opnå bedre overordnet udledning over hele linjen. Gruppering af transaktioner ved hjælp af InteractionGroupingId i detailscenarier kan f.eks. hjælpe systemet med at lære om produkter, der er af typen "Ofte købt sammen" eller findes i en indkøbsvogn, eller opgaver, der er udført i rollen "Næste bedste handling" eller lignende varer i "Folk synes også godt om".

UserId bruges af systemet til at modellere de relationer, der dannes mellem varer og brugere, der interagerer med varer, som – afhængigt af hvordan modellen er fokuseret – kan oprette både personlige og ikke-personlige modelleringsscenarier. I den personlige fremgangsmåde med UserId modellerer systemet en tilknytning mellem brugere og elementer baseret på de historiske præferencer for de enkelte brugere. Derefter produceres modellen "baseret på din tidligere historik, synes du måske om"-modellen, der omtales som "Udvalgt til dig".

ItemId er den faktiske varereference. Det er vigtigt at knytte hver enkelt vare til dens interaktioner og lade mønstrene komme til syne i modellen. ItemId'er, der ikke har interaktioner, vises ikke i anbefalinger for andre produkter, og de kan også være udsat for dårlige interaktioner, når de bruges som input til modeller som "Personer, der synes godt om denne vare, vil muligvis også synes om".

ItemVariantId bruges primært til scenariet "Tilsvarende looks" og VBS-algoritmen (Visual Based Similarity), som tager højde for billedmetadata i stedet for interaktioner. Dette felt er ikke påkrævet for modeller og algoritmer, der er afhængige af interaktioner.

Du kan få mere at vide om de påkrævede dataobjekter pr. scenarie i tabellen over tilknytning af dataobjekter.

Tilbage til toppen

Kan jeg bruge varemetadata som kategori, farve, model osv.?

Varemetadata kan være nyttige på mange måder:

  • Bedre modellering af varer ud over inputtet fra interaktioner, så varer med få eller slet ingen interaktioner (kolde varer) stadig kan komme med "Andre synes også godt om"-anbefalinger.
  • Det er muligt at have en model, der er fuldstændig baseret på varemetadata (f.eks. indholdskoder) og returnerer anbefalinger af typen "Tilsvarende varer".
    • Sådan gør du: Giv metadataelementet et TagId. I interaktionsdataobjektet skal du angive InteractionGroupingId som TagId for hver interaktionsrække, mens varen bevares som ItemId, og brugeren bevares som UserID. Du kan få mere at vide om, hvordan TagIds fungerer, i vejledning til mærkning af metadata og brugerinddeling.

[VIGTIG NOTE]

Brug en separat konto til en varemetadatabaseret model, så du har 1 IR-model pr. IR-konto, og de er adskilt fra den direkte brugerinteraktionsbaserede model/konto.

  • Varer med informative tekstbaserede beskrivelser kan give anbefalinger af typen "Lignende beskrivelse", der er baseret på vores dybdegående NLP-model.
  • Elementer og varianter med billeder kan komme med "Tilsvarende look"-anbefalinger, der er baseret på vores dybdegående læringsmodel med visuel genkendelse.

Tilbage til toppen.

Kan jeg bruge brugermetadata som demografi til at tilpasse anbefalingerne?

Tjenesten til Intelligent Recommendations giver kunderne mulighed for at medtage brugermetadata via en proces med mærkning af metadata. Brugermetadata kan være effektive i forhold til at anbefale relevant indhold til alle brugere, herunder

  • Nye eller sjældne kunder (også kaldet "kolde brugere").
  • At skabe forbindelse mellem brugere og almindelige attributter med metadatamærkning. Hvis du have mere at vide om demografisk inddeling med anbefalinger og se eksempler, kan du se vejledning til mærkning af metadata og brugerinddeling.

Tilbage til toppen.

Kan jeg præsentere bruger til bruger-anbefalinger?

I øjeblikket understøttes fulde bruger til bruger-anbefalinger ikke. I øjeblikket er det muligt, at nogle datasæt kan få bruger til bruger-anbefalinger, ved at foretage nogle ændringer i datakontrakten:

  • For hvert original interaktionsinput skal hver række sammensættes på følgende måde:
    • Skriv ItemID i kolonnen InteractionGroupingId
    • Skriv UserID i kolonnen ItemId
    • Foretag API-anmodningen: Når du har udført de tidligere ændringer i datakontrakten, kaldes listetypen "Andre har også" med det pågældende UserId, og der returneres en liste over tilsvarende brugere.

Tilbage til toppen.

Hvor kan jeg få mere at vide om matrixfaktoriseringsmodellen, der bruges sammen med Intelligent Recommendations?

Vores MF-model: Samarbejdsfiltrering med én klasse og tilfældige grafer. Vi har udviklet en in-house-version af bayesisk matrixfaktorisering, som vi har beskrevet her. Den kan bruges til at lære om eventuelle indlejringer, som vi har forklaret her.

Tilbage til toppen.

Se også

Vejledning til fejlfinding
API-statuskoder
Datakontrakt
Tabel over tilknytning af dataobjekter.
Vejledning til mærkning af metadata og brugerinddeling.