Entrenamiento del recomendador SVD

2024-09-01

En este artículo se describe cómo usar el componente Entrenamiento del recomendador de SVD del diseñador de Azure Machine Learning. Use este componente para entrenar un modelo de recomendación basado en el algoritmo de descomposición en valores singulares (SVD).

El componente Entrenamiento del recomendador de SVD lee un conjunto de datos de tripletas usuario-elemento-clasificación. Devuelve un recomendador SVD entrenado. Después, puede usar el modelo entrenado para predecir las clasificaciones o generar recomendaciones mediante la conexión del componente de puntuación del recomendador SVD.

Más información sobre los modelos de recomendación y el recomendador SVD

El objetivo principal de un sistema de recomendación es recomendar uno o más elementos a usuarios del sistema. Algunos ejemplos de elementos pueden ser una película, un restaurante, un libro o una canción. Un usuario podría ser una persona, un grupo de personas u otra entidad con preferencias de elementos.

Existen dos enfoques principales para los sistemas de recomendación:

Un enfoque basado en el contenido hace uso de las características tanto para usuarios como para elementos. Los usuarios se pueden describir mediante propiedades como la edad y el género. Los usuarios se pueden describir mediante propiedades como el creador y el fabricante. En los sitios de encuentros sociales se pueden encontrar ejemplos típicos de sistemas de recomendación basados en contenido.
Los filtros de colaboración usan solo identificadores de los usuarios y los elementos. Obtienen información implícita sobre estas entidades de una matriz (dispersa) de clasificaciones dadas por los usuarios a los elementos. Podemos obtener información sobre un usuario tanto a partir de los elementos que ha calificado como de otros usuarios que han calificado los mismos elementos.

El recomendador SVD usa identificadores de los usuarios y los elementos, así como una matriz de las clasificaciones que los usuarios le proporcionan a los elementos. Es un recomendador colaborativo.

Para más información sobre el recomendador SVD, consulte el artículo de investigación pertinente: Técnicas de factorización de matriz para los sistemas de recomendación.

Cómo configurar el entrenamiento del recomendador SVD

Preparación de los datos

Antes de usar el componente, los datos de entrada deben estar en el formato que el modelo de recomendación espera. Se requiere un conjunto de datos de aprendizaje de tripletas usuario-elemento-clasificación.

La primera columna contiene los identificadores de usuario.
La segunda columna contiene los identificadores de elemento.
La tercera columna contiene la clasificación del par usuario-elemento. Los valores de clasificación deben ser numéricos.

El conjunto de datos Clasificaciones de películas del diseñador de Azure Machine Learning (seleccione Conjuntos de datos y luego Ejemplos) muestra el formato esperado:

Clasificaciones de películas

En este ejemplo, se puede ver que un único usuario ha clasificado varias películas.

Entrenamiento del modelo

Agregue el módulo Entrenamiento del recomendador de SVD a la canalización del diseñador y conéctelo a los datos de aprendizaje.
En Number of factors (Número de factores), escriba el número de factores que se van a usar con el recomendador.

Cada uno de ellos mide la relación del usuario con el elemento. El número de datos también representa la dimensionalidad del espacio del dato latente. Con el aumento del número de usuarios y de elementos, se recomienda establecer un mayor número de factores. Pero tenga en cuenta que si el número es demasiado grande, es posible que el rendimiento baje.
Número de iteraciones recomendadas del algoritmo indica el número de veces que el algoritmo debe procesar los datos de entrada. Cuanto mayor sea este número, más precisas serán las predicciones. Sin embargo, un número mayor también significa que el aprendizaje será más lento. El valor predeterminado es 30.
En Learning rate (Velocidad de aprendizaje), escriba un número entre 0,0 y 2,0 que defina el tamaño del paso durante el aprendizaje.

La velocidad de aprendizaje determina el tamaño del paso en cada iteración. Si el tamaño del paso es demasiado grande, puede pasar por alto la solución óptima. Si el tamaño del paso es demasiado pequeño, el aprendizaje tarda más tiempo en encontrar la mejor solución.
Envíe la canalización.

Resultados

Una vez completado el trabajo de canalización, para usar el modelo para la puntuación, conecte el módulo de entrenamiento del recomendador SVD al módulo de puntuación del recomendador SVD para predecir valores para los nuevos ejemplos de entrada.

Pasos siguientes

Vea el conjunto de componentes disponibles para Azure Machine Learning.