Avanzando Sistemas de Recomendación con Aprendizaje Profundo
El nuevo modelo mejora las recomendaciones, solucionando problemas de arranque en frío y aprovechando los atributos de usuario y de ítems.
― 7 minilectura
Tabla de contenidos
En los últimos años, el aprendizaje profundo ha tenido un gran impacto en muchas áreas, como el reconocimiento de imágenes, la comprensión del habla y el procesamiento del lenguaje. Con este éxito, muchos investigadores han estado buscando cómo el aprendizaje profundo puede mejorar los sistemas de recomendación, que ayudan a la gente a encontrar lo que quiere entre una gran cantidad de contenido en línea. Los métodos tradicionales para estos sistemas han funcionado bien al capturar preferencias basadas en interacciones pasadas entre usuarios y artículos, pero a menudo se pierden detalles importantes sobre los usuarios y los artículos en sí. Esto puede generar problemas, especialmente para artículos menos populares o nuevos usuarios.
El Desafío de los Problemas de Inicio en Frío
Un gran desafío en los sistemas de recomendación es lo que se conoce como el problema de inicio en frío. Esto ocurre cuando no hay suficientes datos para hacer buenas recomendaciones, ya sea porque un nuevo usuario acaba de unirse a la plataforma o porque se ha agregado un nuevo artículo. Los modelos tradicionales pueden tener dificultades en estas situaciones, ya que dependen mucho de las interacciones entre usuarios y artículos. Creemos que al usar las características y cualidades tanto de los usuarios como de los artículos, podemos crear un enfoque mejor para las recomendaciones.
Factorización de Matrices
Nuestra Solución: Mejora de laHemos desarrollado un nuevo tipo de modelo de recomendación que toma en cuenta no solo las interacciones entre usuarios y artículos, sino también los atributos relacionados con ambos. Nuestro modelo usa un método llamado factorización de matrices, que descompone los datos de interacción usuario-artículo en partes más simples y manejables. Al hacer esto, nuestro modelo puede aprender a proporcionar recomendaciones más precisas, especialmente en situaciones donde los datos son limitados.
Una de las características clave de nuestro modelo es el uso de embeddings compartidos de usuarios. Esto significa que en lugar de comenzar con conjeturas aleatorias o datos de usuario débilmente aprendidos, nuestro modelo utiliza una representación común de un usuario que puede respaldar las recomendaciones, especialmente para nuevos usuarios. Esto ayuda a estabilizar y mejorar la calidad de las recomendaciones proporcionadas a estos usuarios.
Mejorando el Modelo de Factorización de Matrices
Mejoramos aún más el modelo tradicional de factorización de matrices al incorporar interacciones entre atributos cruzados. Esto significa que las características de cada usuario pueden interactuar con los atributos de los artículos y viceversa. Al hacer esto, podemos extraer información más valiosa de los datos existentes.
Por ejemplo, si tenemos un usuario que le gustan las películas de acción y también sabemos el género de una nueva película, podemos hacer mejores recomendaciones combinando estos detalles. Este enfoque captura tanto los rasgos individuales de los usuarios como las conexiones entre usuarios y artículos, lo que lleva a una imagen más completa de las preferencias.
Probando Nuestro Modelo
Para evaluar la efectividad de nuestro modelo, realizamos experimentos utilizando dos conjuntos de datos bien conocidos: MovieLens y Pinterest. Estos conjuntos de datos son populares porque proporcionan numerosas interacciones entre usuarios y artículos y una variedad de atributos. Nuestros tests mostraron que nuestro modelo superó consistentemente a los métodos existentes, particularmente en casos donde los conjuntos de datos tenían información limitada.
Entendiendo los Conjuntos de Datos
Conjunto de Datos MovieLens
En el conjunto de datos MovieLens, utilizamos una versión que incluye un millón de valoraciones, asegurando que cada usuario haya valorado al menos 20 películas. En este conjunto de datos, las valoraciones se transforman de modo que cada valoración de un usuario corresponde a una etiqueta para una película. Además, seleccionamos al azar 99 entradas no observadas como muestras negativas, lo que significa que no recibieron ninguna valoración.
Este conjunto de datos también incluye metadatos para los usuarios, como género, edad y ocupación. Estos detalles sirven como atributos de usuario en nuestro modelo. Para las películas, dado que pueden pertenecer a múltiples géneros, cada género se considera un atributo separado.
Conjunto de Datos Pinterest
El conjunto de datos Pinterest es vasto y tiene muchos usuarios, pero muchos de ellos solo han fijado unos pocos elementos. Para hacer nuestra evaluación más manejable, filtramos el conjunto de datos para incluir solo usuarios con al menos diez fijaciones. Al igual que en MovieLens, etiquetamos 99 entradas no observadas como muestras negativas.
Este conjunto de datos ofrece información sobre las interacciones de los usuarios con varios pines y categorías de página. Agrupamos a los usuarios según su número de fijaciones y simplificamos las numerosas categorías en grupos principales para un mejor análisis.
Evaluación y Métricas
Usamos un método de leave-one-out para la evaluación. Para cada usuario, elegimos una de sus interacciones al azar y la combinamos con las 99 muestras negativas para crear un conjunto de prueba. Clasificamos el elemento de prueba entre 100 y evaluamos el rendimiento usando dos métricas clave: Hit Ratio (HR@10) y Normalized Discounted Cumulative Gain (NDCG@10). La métrica HR verifica si el elemento recomendado está en la lista de los diez mejores, mientras que NDCG asigna puntajes más altos a los elementos clasificados más arriba en la lista.
Resumen del Rendimiento
Los resultados de nuestros experimentos indican claramente que nuestro modelo hace un mejor trabajo que los modelos existentes, particularmente en situaciones de datos escasos. Como observamos en ambos conjuntos de datos, MovieLens y Pinterest, nuestro modelo produjo consistentemente resultados sólidos.
A medida que aumentamos la complejidad de nuestra factorización de matrices, el rendimiento de nuestro modelo mejoró, especialmente en lo que respecta a la métrica HR@10. Esto era de esperarse porque nuestro modelo fue diseñado para aprovechar al máximo tanto las interacciones usuario-artículo como sus atributos inherentes.
Curiosamente, un modelo existente conocido como Attribute-Aware Deep CF (AA Deep CF) no tuvo un rendimiento tan bueno como se esperaba. Esto puede deberse a la capa de pooling que utiliza, que potencialmente podría desechar detalles importantes, lo que llevaría a recomendaciones menos efectivas. Además, el modelo AA Deep CF fue creado principalmente para redes sociales y tareas de recomendación de viajes, lo que puede no alinearse con las necesidades de nuestros conjuntos de datos.
Conclusión
Nuestra investigación destaca avances significativos en el campo de los sistemas de recomendación. La introducción de un embedding de usuario compartido ofrece una solución sólida para nuevos usuarios que enfrentan problemas de inicio en frío. Además, el enfoque refinado de factorización de matrices que incluye interacciones entre atributos cruzados permite un reconocimiento más profundo de las relaciones usuario-artículo, aprovechando al máximo toda la información disponible.
En general, estas mejoras marcan pasos importantes hacia la entrega de recomendaciones más precisas y confiables. Esto abre la puerta a futuras investigaciones en este dominio para explorar modelos y estrategias aún más efectivas.
Título: Cross-Attribute Matrix Factorization Model with Shared User Embedding
Resumen: Over the past few years, deep learning has firmly established its prowess across various domains, including computer vision, speech recognition, and natural language processing. Motivated by its outstanding success, researchers have been directing their efforts towards applying deep learning techniques to recommender systems. Neural collaborative filtering (NCF) and Neural Matrix Factorization (NeuMF) refreshes the traditional inner product in matrix factorization with a neural architecture capable of learning complex and data-driven functions. While these models effectively capture user-item interactions, they overlook the specific attributes of both users and items. This can lead to robustness issues, especially for items and users that belong to the "long tail". Such challenges are commonly recognized in recommender systems as a part of the cold-start problem. A direct and intuitive approach to address this issue is by leveraging the features and attributes of the items and users themselves. In this paper, we introduce a refined NeuMF model that considers not only the interaction between users and items, but also acrossing associated attributes. Moreover, our proposed architecture features a shared user embedding, seamlessly integrating with user embeddings to imporve the robustness and effectively address the cold-start problem. Rigorous experiments on both the Movielens and Pinterest datasets demonstrate the superiority of our Cross-Attribute Matrix Factorization model, particularly in scenarios characterized by higher dataset sparsity.
Autores: Wen Liang, Zeng Fan, Youzhi Liang, Jianguo Jia
Última actualización: 2023-08-14 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2308.07284
Fuente PDF: https://arxiv.org/pdf/2308.07284
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.