Preparar Recomendador SVD

Este artigo descreve como utilizar o componente Train SVD Recommender no estruturador do Azure Machine Learning. Utilize este componente para preparar um modelo de recomendação com base no algoritmo de Decomposição de Valor Único (SVD).

O componente Train SVD Recommender lê um conjunto de dados de triplos de classificação de item de utilizador. Devolve um recomendador de SVD preparado. Em seguida, pode utilizar o modelo preparado para prever classificações ou gerar recomendações ao ligar o componente SVD Recommender de Classificação .

Mais informações sobre os modelos de recomendação e o recomendador SVD

O principal objetivo de um sistema de recomendações é recomendar um ou mais itens aos utilizadores do sistema. Exemplos de um item podem ser um filme, restaurante, livro ou música. Um utilizador pode ser uma pessoa, um grupo de pessoas ou outra entidade com preferências de item.

Existem duas abordagens principais para sistemas recomendadores:

  • Uma abordagem baseada em conteúdos utiliza funcionalidades para utilizadores e itens. Os utilizadores podem ser descritos por propriedades como a idade e o sexo. Os itens podem ser descritos por propriedades como autor e fabricante. Pode encontrar exemplos típicos de sistemas de recomendação baseados em conteúdos em sites de correspondência de redes sociais.
  • A filtragem colaborativa utiliza apenas identificadores dos utilizadores e dos itens. Obtém informações implícitas sobre estas entidades a partir de uma matriz (dispersa) de classificações dadas pelos utilizadores aos itens. Podemos saber mais sobre um utilizador a partir dos itens que classificou e de outros utilizadores que classificaram os mesmos itens.

O recomendador de SVD utiliza identificadores dos utilizadores e dos itens, bem como uma matriz de classificações atribuídas pelos utilizadores aos itens. É um recomendador de colaboração.

Para obter mais informações sobre o recomendador de SVD, veja o documento de investigação relevante: Matrix factorization techniques for recommender systems (Técnicas de fatorização de matriz para sistemas recomendados).

How to configure Train SVD Recommender

Preparar dados

Antes de utilizar o componente, os dados de entrada têm de estar no formato esperado pelo modelo de recomendação. É necessário um conjunto de dados de preparação de triplos de classificação de itens de utilizador.

  • A primeira coluna contém identificadores de utilizador.
  • A segunda coluna contém identificadores de itens.
  • A terceira coluna contém a classificação para o par de itens de utilizador. Os valores de classificação têm de ser de tipo numérico.

O conjunto de dados Classificações de Filmes no estruturador do Azure Machine Learning (selecione Conjuntos de dados e, em seguida , Exemplos) demonstra o formato esperado:

Classificações de Filmes

Neste exemplo, pode ver que um único utilizador classificou vários filmes.

Preparar o modelo

  1. Adicione o componente Train SVD Recommender ao pipeline no estruturador e ligue-o aos dados de preparação.

  2. Em Número de fatores, especifique o número de fatores a utilizar com o recomendador.

    Cada fator mede a relação entre o utilizador e o item. O número de fatores é também a dimensionalidade do espaço do fator latente. Com o aumento do número de utilizadores e itens, é melhor definir um maior número de fatores. No entanto, se o número for demasiado grande, o desempenho poderá diminuir.

  3. O número de iterações de algoritmos de recomendação indica quantas vezes o algoritmo deve processar os dados de entrada. Quanto maior for este número, mais exatas são as predições. No entanto, um número mais elevado significa uma preparação mais lenta. O valor predefinido é 30.

  4. Para Taxa de aprendizagem, introduza um número entre 0,0 e 2.0 que defina o tamanho do passo para a aprendizagem.

    A taxa de aprendizagem determina o tamanho do passo em cada iteração. Se o tamanho do passo for demasiado grande, poderá ultrapassar a solução ideal. Se o tamanho do passo for demasiado pequeno, a preparação demora mais tempo a encontrar a melhor solução.

  5. Submeta o pipeline.

Resultados

Após a conclusão da tarefa de pipeline, para utilizar o modelo para classificação, ligue o Programador de Preparação SVD ao Recomendador SVD de Classificação, para prever valores para novos exemplos de entrada.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.