Avanzando Recomendaciones con el Marco MBGen
Un nuevo enfoque para mejorar las recomendaciones de múltiples comportamientos.
― 8 minilectura
Tabla de contenidos
- Resumen del Problema
- Por Qué Importa Predecir Comportamientos
- Un Nuevo Marco: MBGen
- Pruebas Extensivas
- Comparación con Modelos Existentes
- Trabajo Relacionado
- Dinámicas de Recomendación Secuencial
- Enfoques de Recomendación Generativa
- Arquitectura de MBGen
- Métricas de Evaluación
- Conclusiones
- Fuente original
- Enlaces de referencia
La recomendación secuencial de múltiples comportamientos se centra en predecir lo que un usuario hará a continuación, considerando diferentes tipos de comportamientos, como hacer clic, comprar o agregar artículos al carrito. Los métodos tradicionales a menudo se concentran solo en predecir el siguiente artículo sin tener en cuenta el tipo de comportamiento involucrado, lo que puede llevar a perder oportunidades para mejores recomendaciones.
En esta charla, presentamos un enfoque nuevo llamado MBGen, que busca mejorar la forma en que hacemos recomendaciones al incorporar tanto el tipo de comportamiento que un usuario podría tener como los artículos en los que podría estar interesado a continuación. El proceso implica dos pasos principales: primero se predice el tipo de comportamiento y luego se predice qué artículo sigue basado en ese comportamiento.
Resumen del Problema
El problema aquí es cómo combinar efectivamente varios comportamientos de usuario para mejorar las recomendaciones. Los métodos anteriores tenían ciertas limitaciones. O bien dividían los comportamientos en grupos para procesarlos por separado o modelaban directamente toda la secuencia de comportamientos sin integrarlos de manera efectiva. Sin embargo, estos enfoques a menudo ignoraban la relación entre los tipos de comportamiento y los artículos recomendados, reduciendo el poder predictivo general de los modelos.
Reconociendo la importancia de las intenciones del usuario detrás de diferentes acciones, nuestro enfoque descompone el proceso de recomendación en dos pasos claros. El primer paso identifica el tipo de comportamiento que se avecina basado en acciones pasadas, y el segundo paso predice el siguiente artículo considerando este tipo de comportamiento previsto.
Por Qué Importa Predecir Comportamientos
Entender el tipo de comportamiento que un usuario es probable que tenga puede mejorar significativamente la precisión de las recomendaciones. Por ejemplo, si un usuario agrega un artículo a su carrito, puede que esté a punto de ir a pagar o que busque artículos relacionados para comprar. Reconocer esto puede guiar a la plataforma para presentar las sugerencias más relevantes.
Además, hacer predicciones sobre tipos de comportamiento abre nuevas oportunidades para mejorar la experiencia del usuario. Si el sistema sabe que un usuario es probable que pague pronto, puede dirigirlo a la página de pago o sugerir artículos complementarios que podrían aumentar la compra total.
Un Nuevo Marco: MBGen
Para abordar las limitaciones de métodos anteriores, MBGen introduce un marco innovador que opera en dos pasos distintos. Comienza con la identificación del siguiente comportamiento, seguido de la predicción del siguiente artículo basado tanto en el comportamiento previsto como en interacciones anteriores. Este enfoque de dos fases asegura que las recomendaciones estén más alineadas con las intenciones del usuario.
Proceso de Dos Pasos
- Predicción del Tipo de Comportamiento: Dada una secuencia de interacciones pasadas, el modelo primero determina qué tipo de comportamiento es probable que el usuario realice a continuación.
- Predicción del Siguiente Artículo: Una vez establecido el tipo de comportamiento, el modelo predice qué artículo podría interactuar el usuario a continuación.
Esta clara separación entre la predicción de comportamiento y artículos permite un enfoque más estructurado para hacer recomendaciones.
Abordando Desafíos
Hay varios desafíos que vienen con este modelo de doble enfoque.
Variabilidad en Espacios de Solución: El número de comportamientos posibles generalmente es pequeño, mientras que el número de artículos puede ser enorme. Esta diferencia de escala puede causar problemas durante el proceso de aprendizaje.
Complejidad del Modelo: Muchos modelos de recomendación actuales no están equipados para manejar esta complejidad, a menudo enfocándose en estructuras más simples que pueden no capturar adecuadamente los patrones presentes en las secuencias de comportamiento y artículos combinados.
Estrategia de Tokenización
MBGen utiliza un método especial llamado tokenización para combinar diferentes aspectos del comportamiento del usuario y las interacciones de artículos en un solo formato. Cada artículo y comportamiento se descompone en tokens, permitiendo al modelo tratar estos tokens como parte de una secuencia más grande. Esta intercalación de tokens ayuda a capturar las relaciones entre ellos de manera más efectiva.
Mecanismo de Atención
Se utiliza un mecanismo de atención dentro de este marco, lo que permite al modelo centrarse en partes específicas de los datos de entrada al hacer predicciones. Esto ayuda a reconocer patrones detallados entre los tipos de comportamientos y los artículos.
Pruebas Extensivas
Para validar la efectividad de MBGen, se llevaron a cabo experimentos extensivos utilizando conjuntos de datos disponibles públicamente. Los resultados revelaron que MBGen superó a modelos existentes, logrando mejoras que oscilan entre el 30% y el 70% en diversas tareas de recomendación.
Comparación con Modelos Existentes
Los métodos históricos en el área de recomendaciones de múltiples comportamientos a menudo utilizan ya sea agregación en dos etapas o modelan toda la secuencia de entrada juntos sin integración entre los tipos de comportamiento y las predicciones de artículos. MBGen se destaca al tratar la predicción de tipos de comportamiento como una parte vital del proceso de recomendación.
Principales Contribuciones
- Marco Estructurado: Al enmarcar la tarea como un proceso secuencial de dos pasos, MBGen puede incorporar tipos de comportamiento en el marco de aprendizaje de manera efectiva.
- Modelo Unificado: MBGen introduce un modelo de recomendación generativa que opera en un objetivo unificado de predicción del siguiente token, mejorando así la sinergia entre la predicción de comportamiento y artículos.
- Robustez en Diferentes Conjuntos de Datos: El modelo fue probado en diferentes conjuntos de datos, demostrando su capacidad para adaptarse y desempeñarse consistentemente bien.
Trabajo Relacionado
Investigaciones anteriores en recomendación secuencial se centraron principalmente en interacciones unidimensionales usuario-artículo. A menudo dependían de diversas arquitecturas, como redes neuronales recurrentes o transformadores, pero no lograban incluir efectivamente el tipo de interacción que ocurría. Esfuerzos recientes han intentado integrar tipos de comportamiento de manera más explícita, sin embargo, aún quedan desafíos en utilizar esta información para mejorar las predicciones.
Dinámicas de Recomendación Secuencial
Los sistemas de recomendación secuencial tradicionales buscan predecir el siguiente artículo basado en interacciones históricas. Se han empleado diversos modelos, desde Cadenas de Markov hasta técnicas de aprendizaje profundo para lograr esto. Sin embargo, a menudo carecen de la capacidad para tener en cuenta los tipos de interacciones, lo que puede llevar a predicciones subóptimas.
Enfoques de Recomendación Generativa
Los sistemas de recomendación generativa han mostrado promesas al ofrecer un rendimiento mejorado mediante el uso de técnicas novedosas para la representación de artículos. Estos sistemas tokenizan los artículos, permitiendo al modelo centrarse en aspectos discretos de los artículos. Sin embargo, muchos de estos enfoques no incorporan datos de comportamiento, limitando su efectividad general.
Arquitectura de MBGen
La arquitectura de MBGen involucra múltiples elementos clave que trabajan juntos para proporcionar recomendaciones precisas.
Modelado a Nivel de Token
El marco se basa en un enfoque basado en tokens donde tanto los comportamientos como las interacciones de artículos se representan como tokens intercambiables. Este diseño permite al modelo lograr una comprensión detallada de las interacciones del usuario.
Arquitectura Sparsidad Ruteada por Posición
Para escalar el modelo de manera eficiente, MBGen emplea una arquitectura sparsidad ruteada por posición. Cada token de la secuencia de interacción se procesa a través de redes expertas dedicadas, lo que mejora el rendimiento general del modelo mientras gestiona la eficiencia computacional.
Métricas de Evaluación
El rendimiento de MBGen fue evaluado utilizando métricas estándar como Recall@K y NDCG@K. Estas métricas son cruciales para determinar qué tan bien el modelo predice interacciones de usuario, especialmente en un entorno de comercio electrónico.
Conclusiones
La introducción de MBGen marca un paso significativo hacia adelante en los sistemas de recomendación secuencial de múltiples comportamientos. Al enfatizar la importancia de predecir tanto los tipos de comportamiento del usuario como los artículos, proporciona un enfoque más preciso y centrado en el usuario para las recomendaciones.
El trabajo futuro se centrará en seguir refinando este marco y explorar métodos de muestreo más avanzados para capacidades de predicción aún mejores. Los resultados hasta ahora demuestran el potencial de mejoras transformadoras en cómo se generan y entregan las recomendaciones en varias aplicaciones.
Título: Multi-Behavior Generative Recommendation
Resumen: Multi-behavior sequential recommendation (MBSR) aims to incorporate behavior types of interactions for better recommendations. Existing approaches focus on the next-item prediction objective, neglecting the value of integrating the target behavior type into the learning objective. In this paper, we propose MBGen, a novel Multi-Behavior sequential Generative recommendation framework. We formulate the MBSR task into a consecutive two-step process: (1) given item sequences, MBGen first predicts the next behavior type to frame the user intention, (2) given item sequences and a target behavior type, MBGen then predicts the next items. To model such a two-step process, we tokenize both behaviors and items into tokens and construct one single token sequence with both behaviors and items placed interleaved. Furthermore, MBGen learns to autoregressively generate the next behavior and item tokens in a unified generative recommendation paradigm, naturally enabling a multi-task capability. Additionally, we exploit the heterogeneous nature of token sequences in the generative recommendation and propose a position-routed sparse architecture to efficiently and effectively scale up models. Extensive experiments on public datasets demonstrate that MBGen significantly outperforms existing MBSR models across multiple tasks.
Autores: Zihan Liu, Yupeng Hou, Julian McAuley
Última actualización: 2024-07-29 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2405.16871
Fuente PDF: https://arxiv.org/pdf/2405.16871
Licencia: https://creativecommons.org/licenses/by-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.