Compartilhar via


Perguntas frequentes sobre a modelagem de Recomendações Inteligentes

Este artigo fornece uma investigação mais profunda dos tipos de algoritmos de modelagem que o serviço Recomendações Inteligentes usa e fornece respostas para perguntas comuns de modelagem.

Conteúdo

Visão geral de Algoritmos do Recomendações Inteligentes

O componente de Modelagem do Recomendações Inteligentes utiliza alguns algoritmos diferentes para criar listas classificadas. A API de Lista responde a consultas e retorna resultados dependendo do tipo de algoritmo selecionado para modelagem. Mais informações sobre os tipos de Algoritmos usados pelo serviço Recomendações Inteligentes são fornecidas na tabela a seguir:

[!Observação]

Como uma melhor prática, use Experimentação para comparar os resultados de alguns tipos de lista diferentes e/ou tipos de dados antes de fazer uma escolha final sobre qual algoritmo é melhor para seu caso de uso de negócios e conjunto de dados (que é uma combinação dos tipos de dados e comportamento real).

Tipo de Algoritmo Descrição
Fatoração de Matriz (MF) A Fatoração de Matriz é um tipo de algoritmo de filtragem colaborativo que se concentra na criação de relacionamentos de usuário para item e item para item com base em interações específicas do usuário (compra, uso, clickthrough, exibições, download etc.). Esse tipo de algoritmo classifica as listas com base nas preferências históricas de um usuário específico, que é o que chamamos de classificação baseada em "gosto" pessoal. Ela também deriva semelhanças entre itens com base em interações de usuários com itens.

A Fatoração de Matriz gera as classificações simétrica (se "A" for semelhante a "B", então "B" também será semelhante a "A") e transitiva (se "A" for semelhante a "B" e "B" for semelhante a "C", então "A" será semelhante a "C"). Para obter melhores resultados, use o tipo de algoritmo de Fatoração de Matriz ao usar um conjunto de dados com sinais de interação substanciais e metadados de catálogo. Esse recurso é ótimo para domínios de entretenimento como Filmes e TV, Jogos ou Streaming, mas funciona bem em outros domínios que dependem de sinais de interação com o cliente, incluindo: Varejo, Mercearia, Itinerários de viagem, Manufatura e muito mais.
Semelhanças Associadas Diretas (DAS) O algoritmo Semelhanças Associadas Diretas (DAS) é adequado para domínios de afinidade locais/direcionados com altas necessidades baseadas em utilidade, como Aplicativos em que a utilidade é mais importante do que a preferência histórica (gosto). Por exemplo, pessoas que fazem ações "A", depois "B" e depois "C", tendem a fazer ações "D" depois. O DAS é assimétrico e não associativo.

Nosso serviço usa o algoritmo DAS para alimentar a API Próxima Melhor Ação, que cria sugestões de conteúdo com base em agrupamentos distintos e repetíveis. Uma aplicação comum de Próxima Melhor Ação é frequentemente vista em experiências de check-out de varejo em cenários de "finalização da cesta" como Frequentemente comprados juntos - que fornece sugestões de itens complementares com base no conteúdo do carrinho de um usuário.

O DAS também pode recombinar grupos e recomendar itens de diferentes subdomínios. Por exemplo, um comprador de supermercado pode receber guardanapos e pratos recomendados com seus hambúrgueres e pãezinhos em seu carrinho.

Os domínios que se beneficiam da "Próxima Melhor Ação" incluem Mercearia, Vendas, Solução de Problemas, Contabilidade e muito mais.
Semelhança Baseada em Visual (VBS) Semelhança Baseada em Visual (VBS) é um algoritmo de cognição visual de aprendizado profundo que retorna recomendações visualmente semelhantes para itens com imagens semelhantes, para um determinado item inicial. Como a Fatoração de Matriz, as recomendações produzidas pelo algoritmo VBS são simétricas.

Essa rede neural convolucional de aprendizado profundo usa "Argus" como backbone, no entanto, é treinada ainda mais usando técnicas mais profundas nas imagens do locatário para invariantes de exibição, fornecendo recomendações muito mais relevantes para o domínio do locatário. O VBS é incrivelmente poderoso em domínios como Moda, Design e Joias, onde os atributos visuais são uma parte importante da venda do produto.
Semelhança Baseada em Texto (TBS) O algoritmo Semelhança Baseada em Texto (TBS) retorna recomendações textualmente semelhantes para um determinado item inicial, concentrando-se no treinamento de um modelo de linguagem nos títulos e descrições dos itens no catálogo fornecido. Esse algoritmo funciona especialmente bem em domínios em que os títulos e as descrições são descritivos, produzindo recomendações exclusivas e intuitivas. O modelo usa o modelo de linguagem baseado em Transformador "TNLR" como um backbone, no entanto, o modelo também usa aprendizado de transferência e técnicas de treinamento mais profundas no conjunto de dados fornecido, permitindo que esse algoritmo forneça recomendações de última geração que semanticamente façam sentido.

O TBS usa o Processamento de Linguagem Natural (NLP) como entrada, tornando este algoritmo aplicável em muitos domínios diferentes, incluindo: itinerários de viagem e excursões, vinícolas, bancos de dados de pesquisa de periódicos científicos, solução de problemas e muito mais.
Navegar em Listas Navegar em listas permite navegar em gráficos baseados em heurística classificados por informações como vendas totais, soma de cliques, data de lançamento ou uma combinação de diferentes métricas. As listas com suporte são: "Novo", "Mais Populares", "Popular". Os gráficos são um ótimo ponto de partida para fazer com que os usuários finais interajam rapidamente com seus produtos e vejam o que há de mais novo e melhor em seu catálogo de produtos.

As listas de navegação podem ser aumentadas ainda mais alterando o tipo de interação de entrada. Por exemplo, um modelo baseado em sinais de compra retorna "produtos comprados mais populares", enquanto alterar os sinais do modelo para exibições retorna "Produtos Mais Vistos".

Voltar ao início

Perguntas frequentes

Esta seção cobre uma série de perguntas comumente feitas sobre modelos de Recomendações Inteligentes e suas aplicações.

Como posso acompanhar o status de modelagem?

Os clientes de Recomendações Inteligentes podem rastrear o status de modelagem de cada um dos modelos criados nas contas. Depois que você configurar um modelo, o serviço criará periodicamente um arquivo de log de status para relatar o status atual de todos os algoritmos (em relação à sua camada de modelagem). Para saber mais sobre como acessar esses logs, consulte Guia dos relatórios de status da modelagem.

Voltar ao início

Qual algoritmo e tipo de lista devo usar para minha empresa?

A seleção de um tipo de lista e algoritmo a ser usado depende do caso de uso de negócios, da experiência e dos dados disponíveis para modelagem. Consulte ListNames, AlgoTypes e Refinements para ver uma lista completa de nomes de lista e combinações de AlgoType disponíveis.

Em geral, as interações de modelagem refletem com o que as pessoas interagem. Por exemplo, descrevemos o tipo de lista "Pessoas também", que usa o algoritmo MF, como "clientes que realizam essa ação, também realizam esta ação". Quando a ação é uma compra, a lista se torna "Pessoas que compraram isso, também compraram."

Os metadados do item também podem ser usados para estabelecer semelhanças entre os itens, assumindo que os metadados são suficientes em volume e qualidade. Por exemplo, os itens com descrições semelhantes podem ser considerados intimamente relacionados, assim como itens com imagens de produtos semelhantes podem estar intimamente relacionados. Esses metadados têm sido úteis para criar resultados para itens quando nenhuma interação está disponível (também conhecida como modelagem de "itens frios").

As abordagens que combinam Interações e baseadas em metadados (para itens e/ou usuários) podem ser usadas com Recomendações Inteligentes para personalizar os cenários e experiências. Use vários modelos diferentes (e use um modelo por conta) para experimentar e ver qual abordagem funciona melhor para seus casos de uso.

Mapeamento de Tipos de dados disponíveis e casos de uso para o Tipo de algoritmo

Tipo de Dados Disponível Cenários Algoritmo
Interações
Por exemplo, Exibições, Compras, Uso etc. O que os usuários fizeram?
Sugestões
Personalização
As pessoas também fazem
Próxima Melhor Ação
Fatoração de Matriz (MF)

Associação Dirigida (DAS)
Metadados textuais
Por exemplo, Título, Descrição
Descrição Semelhante Semelhança Baseada em Texto (TBS)
Metadados visuais
Por exemplo, Imagens de produtos de vários ângulos
Aparências semelhantes
Observação: nem todos os domínios se encaixam neste cenário. Você deve usá-lo no caso em que as imagens são uma boa representação de um item.
Semelhança Baseada em Visual (VBS)
Outros metadados de item
Por exemplo, Forma, Categoria, Marcas etc.
Igual às Interações.
O serviço também permite a criação de modelos de diversas formas:
- De forma híbrida, combinando metadados de itens com interações
- Ou criado usando somente Metadados de item (com os algoritmos MF ou DAS)
Fatoração de Matriz (MF)

Associação Dirigida (DAS)
Metadados do usuário
Por exemplo, Dados demográficos
Os cenários relevantes ficam em torno da Personalização do Usuário:
- Sugestões
- Personalização

O serviço permite a criação de modelos de diversas formas:
- De forma híbrida, combinando Metadados de usuário com Interações
- Ou criado usando somente Metadados de usuário (com os algoritmos MF ou DAS)
Fatoração de Matriz (MF)

Associação Dirigida (DAS)

Voltar ao início

Como devo decidir se devo usar os algoritmos Fatoração de Matriz ou Associação Direta?

É recomendável tentar ambos com seus dados para ver qual algoritmo retorna resultados mais adequados com base em seus requisitos de negócios.

Tente o algoritmo Fatoração de Matriz (MF) se:

  • A conexão entre os itens em seu domínio é principalmente Comutativa (simétrica, ou seja, se A=>B então B=>A) e Associativa (isto é, se A=>B e B=>C então A=>B).
  • Seus dados são escassos e você ainda deseja recomendações suficientes para muitos itens.

Tente o algoritmo de Associação Direta (DAS) se:

  • A conexão entre os itens em seu domínio é principalmente diretiva (assimétrica, ou seja, A=>B não significa B=>A) e direta (não associativa).
  • "Próxima Melhor Ação" (dada uma lista ordenada de itens, qual deve ser a próxima) é um cenário importante para você.
  • Você deseja recomendar um subdomínio de seus itens para outro.
  • A Conexão Direta que aparece mais deve se refletir mais nos resultados.

Para obter mais informações, veja ListNames, Tabela AlgoTypes, Refinements.

Voltar ao início

De quantas interações eu preciso para garantir boas recomendações?

Para modelar adequadamente um damian para um conjunto de produtos importantes, cada produto deve conter pelo menos cinco interações ou mais para cenários como "As pessoas também gostaram" ou "Sugestões" (personalização). Você também precisa de interações suficientes que incluam mais de um produto, agrupadas pela InteractionGroupingId (cada item no mesmo pedido teria uma linha na entidade de dados Interações com a mesma InteractionGroupingId) para gerar resultados para "Próxima melhor ação".

Uma boa regra de ouro é tentar ter cerca de cinco vezes mais interações do que o número de itens. por exemplo, se houver 1.000 itens no catálogo, seria bom tentar modelar com pelo menos 5.000 interações.

Em caso de dúvida, é útil experimentá-lo com um modelo simples (menos colunas) e o máximo possível de interações (mais linhas) no conjunto de dados de entrada. Para avaliar a qualidade do seu contrato de dados e ver as métricas relacionadas ao desempenho do modelo, veja Painéis de Recomendações Inteligentes.

Voltar ao início

Por que preciso de InteractionGroupingId, UserId, ItemId e ItemVariantId incluídas em minha Entidade de Dados de Interações?

InteractionGroupingId indica para os grupos conectados ao sistema, especialmente para itens, para melhor inferência geral em toda a linha. Por exemplo, agrupar transações por InteractionGroupingId no cenário de varejo pode ajudar o sistema a saber quais produtos são “comprados com frequência juntos” em um carrinho de compras ou tarefas que são concluídas em uma função para “Próxima melhor ação” ou itens semelhantes em “ As pessoas também gostam”.

UserId é utilizado pelo sistema para modelar os relacionamentos formados entre itens e usuários que interagem com itens que, dependendo de como o modelo é focado, podem criar cenários de modelagem personalizados e não personalizados. Na abordagem Personalizada com UserId, o sistema modela um mapeamento entre usuários e itens com base nas preferências passadas de cada usuário específico. Em seguida, ele produz o modelo “com base em seu histórico anterior, você pode gostar”, conhecido como “Sugestões”.

ItemId é a referência de item real. É essencial conectar cada item com suas interações e permitir que os padrões surjam no modelo. ItemIds que não têm interações não aparecerão em recomendações para outros produtos e também podem sofrer recomendações ruins quando usados como a semente de modelos como "Pessoas que gostaram deste item também gostaram de".

ItemVariantId é usada principalmente para o cenário "Aparências semelhantes" e o algoritmo Semelhança Baseada em Visual (VBS), que leva em conta os metadados da imagem em vez das interações. Este campo não é obrigatório para Modelos e Algoritmos que dependem de Interações.

Para saber mais sobre as entidades de dados necessárias por cenário, veja Tabela de mapeamento de entidades de dados.

Voltar ao início

Posso usar Metadados de Item como Categoria, Cor, Modelo etc.?

Os metadados do item podem ser úteis de várias maneiras:

  • Melhor modelagem de itens além da entrada de interações, de modo que itens com poucas ou mesmo nenhuma interação (itens frios) ainda possam receber recomendações de "As pessoas também gostaram".
  • É possível ter um modelo totalmente baseado em metadados de item (como marcas de conteúdo) e retornar um resultado de recomendações do tipo "itens semelhantes".
    • Como fazer isso: atribua uma TagId ao item de metadados. Na Entidade de Dados de Interações, para cada linha de interação, defina InteractionGroupingId como TagId, mantendo o item como ItemId e o usuário como UserID. Para saber mais sobre o funcionamento de TagIds, veja o guia de marcação e segmentação de metadados.

[!OBSERVAÇÃO IMPORTANTE]

Use uma conta separada para o modelo baseado em Metadados do Item, de modo que você tenha 1 modelo IR por conta IR e eles sejam separados do modelo/conta baseado em interações do usuário puro.

  • Itens com descrições textuais informativas podem obter recomendações de "Descrição semelhante", orientadas por nosso modelo profundo de NLP.
  • Itens e variantes com imagens podem obter recomendações de "Aparência semelhante", orientadas por nosso modelo de aprendizado profundo de cognição visual.

Voltar ao topo.

Posso usar Metadados do Usuário, como dados demográficos, para personalizar recomendações?

O serviço Recomendações Inteligentes permite que os clientes incluam metadados do usuário por meio de um processo de marcação de metadados. Os metadados do usuário podem ser poderosos para recomendar conteúdo relevante a todos os usuários, incluindo

  • Clientes novos ou pouco frequentes (também conhecidos como "usuários frios").
  • Conectando usuários com atributos comuns com marcação de metadados. Para saber mais sobre segmentação demográfica com recomendações e ver exemplos, veja o guia de marcação e segmentação de metadados.

Voltar ao topo.

Posso fazer recomendações de usuário para usuário?

No momento, recomendações completas de Usuário para Usuário não têm suporte. Por enquanto, é possível que alguns conjuntos de dados obtenham recomendações de usuário para usuário, fazendo algumas alterações no Contrato de Dados:

  • Para cada entrada de interação original, construa cada linha para:
    • Grave ItemID na coluna InteractionGroupingId
    • Grave UserID na coluna ItemId
    • Crie a Solicitação de API: depois de fazer as alterações anteriores no contrato de dados, a lista do tipo "As pessoas também" será chamada com a UserId e retornará uma lista de usuários semelhantes.

Voltar ao topo.

Onde posso aprender mais sobre o modelo Fatoração de Matriz usado com Recomendações Inteligentes?

Nosso modelo MF: filtragem colaborativa de uma classe com gráficos aleatórios. Desenvolvemos uma versão interna da fatoração de matriz bayesiana, que descrevemos aqui e pode ser usada para aprender qualquer incorporação, conforme explicamos aqui.

Voltar ao topo.

Confira também

Guia de solução de problemas
Códigos de Status da API
Contrato de Dados
Tabela de Mapeamento de Entidades de Dados.
Guia de marcação e segmentação de metadados.