Classificar Recomendador SVD

Este artigo descreve como utilizar o componente Score SVD Recommender no estruturador do Azure Machine Learning. Utilize este componente para criar predições com um modelo de recomendação preparado com base no algoritmo de Decomposição de Valor Único (SVD).

O recomendador de SVD pode gerar dois tipos diferentes de predições:

Quando estiver a criar o segundo tipo de predições, pode operar num destes modos:

  • O modo de produção considera todos os utilizadores ou itens. Normalmente, é utilizado num serviço Web.

    Pode criar pontuações para novos utilizadores e não apenas para os utilizadores vistos durante a preparação. Para obter mais informações, veja as notas técnicas.

  • O modo de avaliação funciona num conjunto reduzido de utilizadores ou itens que podem ser avaliados. Normalmente, é utilizado durante as operações de pipeline.

Para obter mais informações sobre o algoritmo recomendador SVD, veja as técnicas de factorização de matriz do documento de pesquisa para sistemas recomendadores.

Como configurar o Recomendador de SVD de Classificação

Este componente suporta dois tipos de predições, cada uma com requisitos diferentes.

Predição de classificações

Quando prevê classificações, o modelo calcula como um utilizador irá reagir a um determinado item, tendo em conta os dados de preparação. Os dados de entrada para classificação têm de fornecer um utilizador e o item a classificar.

  1. Adicione um modelo de recomendação preparado ao pipeline e ligue-o ao recomendador de SVD Preparado. Tem de criar o modelo com o componente Train SVD Recommender .

  2. Para Tipo de predição recomendador, selecione Predição de Classificação. Não são necessários outros parâmetros.

  3. Adicione os dados para os quais pretende fazer predições e ligue-os ao Conjunto de Dados para pontuar.

    Para que o modelo preveja classificações, o conjunto de dados de entrada tem de conter pares de item de utilizador.

    O conjunto de dados pode conter uma terceira coluna opcional de classificações para o par user-item nas primeira e segunda colunas. Mas a terceira coluna será ignorada durante a predição.

  4. Submeta o pipeline.

Resultados das predições de classificação

O conjunto de dados de saída contém três colunas: utilizadores, itens e a classificação prevista para cada utilizador e item de entrada.

Recomendações para utilizadores

Para recomendar itens para os utilizadores, forneça uma lista de utilizadores e itens como entrada. A partir destes dados, o modelo utiliza os seus conhecimentos sobre itens e utilizadores existentes para gerar uma lista de itens com provável apelo a cada utilizador. Pode personalizar o número de recomendações devolvidas. Além disso, pode definir um limiar para o número de recomendações anteriores que são necessárias para gerar uma recomendação.

  1. Adicione um modelo de recomendação preparado ao pipeline e ligue-o ao recomendador de SVD Preparado. Tem de criar o modelo com o componente Train SVD Recommender .

  2. Para recomendar itens para uma lista de utilizadores, defina o tipo de predição Recomendador como Recomendação de Item.

  3. Para a seleção de itens recomendada, indique se está a utilizar o componente de classificação na produção ou para a avaliação do modelo. Escolha um destes valores:

    • Em Todos os Itens: selecione esta opção se estiver a configurar um pipeline para utilizar num serviço Web ou em produção. Esta opção ativa o modo de produção. O componente faz recomendações de todos os itens vistos durante a preparação.

    • Em Itens Classificados (para avaliação de modelos): selecione esta opção se estiver a desenvolver ou a testar um modelo. Esta opção ativa o modo de avaliação. O componente faz recomendações apenas a partir dos itens no conjunto de dados de entrada que foram classificados.

    • De Itens Não Classificados (para sugerir novos itens aos utilizadores): selecione esta opção se pretender que o componente faça recomendações apenas a partir dos itens no conjunto de dados de preparação que não foram classificados.

  4. Adicione o conjunto de dados para o qual pretende fazer predições e ligue-o ao Conjunto de Dados para pontuar.

    • Para De Todos os Itens, o conjunto de dados de entrada deve consistir numa coluna. Contém os identificadores dos utilizadores para os quais deve fazer recomendações.

      O conjunto de dados pode incluir duas colunas adicionais de identificadores de itens e classificações, mas estas duas colunas são ignoradas.

    • Para From Rated Items (para avaliação de modelo), o conjunto de dados de entrada deve consistir em pares de item de utilizador. A primeira coluna deve conter o identificador de utilizador. A segunda coluna deve conter os identificadores de itens correspondentes.

      O conjunto de dados pode incluir uma terceira coluna de classificações de item de utilizador, mas esta coluna é ignorada.

    • Para De Itens Não Classificados (para sugerir novos itens aos utilizadores), o conjunto de dados de entrada deve consistir em pares de itens de utilizador. A primeira coluna deve conter o identificador de utilizador. A segunda coluna deve conter os identificadores de itens correspondentes.

    O conjunto de dados pode incluir uma terceira coluna de classificações de item de utilizador, mas esta coluna é ignorada.

  5. Número máximo de itens a recomendar a um utilizador: introduza o número de itens a devolver para cada utilizador. Por predefinição, o componente recomenda cinco itens.

  6. Tamanho mínimo do conjunto de recomendações por utilizador: introduza um valor que indique quantas recomendações anteriores são necessárias. Por predefinição, este parâmetro está definido como 2, o que significa que pelo menos dois outros utilizadores recomendaram o item.

    Utilize esta opção apenas se estiver a pontuar no modo de avaliação. A opção não está disponível se selecionar De Todos os Itens ou De Itens Não Classificados (para sugerir novos itens aos utilizadores).

  7. Para De Itens Não Classificados (para sugerir novos itens aos utilizadores), utilize a terceira porta de entrada, denominada Dados de Preparação, para remover itens que já foram classificados dos resultados da predição.

    Para aplicar este filtro, ligue o conjunto de dados de preparação original à porta de entrada.

  8. Submeta o pipeline.

Resultados da recomendação do item

O conjunto de dados classificado devolvido pelo Recomendador de Classificação SVD lista os itens recomendados para cada utilizador:

  • A primeira coluna contém os identificadores de utilizador.
  • São geradas várias colunas adicionais, consoante o valor que definiu para Número máximo de itens a recomendar a um utilizador. Cada coluna contém um item recomendado (por identificador). As recomendações são ordenadas por afinidade utilizador-item. O item com maior afinidade é colocado na coluna Item 1.

Notas técnicas

Se tiver um pipeline com o recomendador SVD e mover o modelo para produção, tenha em atenção que existem diferenças fundamentais entre utilizar o recomendador no modo de avaliação e utilizá-lo no modo de produção.

Por definição, a avaliação requer predições que podem ser verificadas relativamente à verdade básica num conjunto de testes. Quando avalia o recomendador, este tem de prever apenas os itens que foram classificados no conjunto de testes. Isto restringe os valores possíveis que estão previstos.

Quando operacionaliza o modelo, normalmente altera o modo de predição para fazer recomendações com base em todos os itens possíveis para obter as melhores predições. Para muitas destas predições, não há nenhuma verdade básica correspondente. Assim, a precisão da recomendação não pode ser verificada da mesma forma que durante as operações do pipeline.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.