Revolucionando las recomendaciones de videos con el modelo C-3PO
Este artículo presenta un nuevo modelo para mejores recomendaciones de videos basado en los hábitos de desplazamiento de los usuarios.
― 7 minilectura
Tabla de contenidos
Las plataformas en línea a menudo muestran listas de recomendaciones para hacer feliz a la gente o ayudar a los negocios. El objetivo principal es mostrar cosas con las que los usuarios probablemente interactúen, como música, películas o productos. Esto significa que los items en la parte superior de la lista tienen más chances de ser vistos o clickeados. Es importante notar que los usuarios suelen interactuar solo con algunos items antes de dejar la lista.
Las redes sociales, especialmente las que se enfocan en videos cortos, funcionan un poco diferente. Los usuarios pueden desplazarse por feeds interminables y generalmente no se van después de ver un solo video. Como se les anima a seguir mirando, los modelos existentes que predicen el Comportamiento del usuario no sirven tan bien.
Este artículo presenta un nuevo modelo para ayudar a recomendar videos de una manera que coincida con cómo los usuarios realmente se desplazan por sus feeds. El enfoque se centra en entender cuánto tiempo está dispuesto a desplazarse un usuario según sus hábitos personales. Usando este nuevo modelo, podemos predecir lo que los usuarios probablemente verán con más precisión.
El Desafío de los Feeds de Videos Cortos
La mayoría de los Sistemas de Recomendación intentan adivinar lo que un usuario quiere al observar cuántas veces hace clic en los items. Pero en los feeds de videos cortos, los usuarios a menudo se desplazan hacia abajo durante mucho tiempo sin parar. Este comportamiento significa que los modelos tradicionales de interacción del usuario no son lo suficientemente buenos.
La forma común de medir el Compromiso del usuario normalmente se enfoca en cuántas veces se hace clic en un item. Lamentablemente, en un feed donde los usuarios siguen desplazándose por muchos videos, los viejos modelos no capturan este comportamiento de desplazamiento correctamente.
Este artículo propone una nueva manera de estimar qué videos es probable que los usuarios hagan clic al observar sus hábitos de desplazamiento. Tratamos el desplazamiento como un presupuesto. Los usuarios tienen una cierta cantidad de desplazamiento que están dispuestos a gastar, lo cual depende de muchos factores. El objetivo es encontrar una forma de estimar mejor cuánto tiempo estará un usuario involucrado con un feed.
Sesgo de posición
Importancia delCuando los items están alineados en una lista, un item en la parte superior tendrá más exposición que uno que está más abajo. Este "sesgo de posición" es crucial a considerar al estudiar el comportamiento del usuario. En muchos casos, los usuarios solo interactúan con los primeros pocos items que ven. Por lo tanto, puede ser engañoso evaluar qué tan bien funciona un modelo de recomendación sin tener en cuenta cómo la posición de los items afecta la interacción del usuario.
Los estudios existentes suelen enfocarse en motores de búsqueda donde los usuarios buscan documentos específicos basados en sus consultas. En estos casos, se ha explorado a fondo el entendimiento del sesgo de posición. Sin embargo, esta misma comprensión no se ha aplicado de manera efectiva a los sistemas de recomendación para feeds que se desplazan sin fin.
El nuevo modelo que proponemos tiene en cuenta el sesgo de posición al medir cuán lejos se desplazan los usuarios y cómo eso afecta sus interacciones con los items. De esta manera, mejoramos la precisión de nuestras recomendaciones basadas en el comportamiento real del usuario.
Enfoque Propuesto: El Modelo C-3PO
Nuestro nuevo modelo, llamado C-3PO, está diseñado para capturar la manera en que los usuarios se desplazan por los feeds. Funciona así: asumimos que los usuarios se acercan al feed con un "presupuesto de desplazamiento". Esto significa que tienen una cierta cantidad de tiempo o interés que dedican a desplazarse. Este presupuesto puede variar de un usuario a otro y depende de muchos factores como la hora del día o hábitos personales.
Usando esta idea, el modelo trata la profundidad de desplazamiento como un factor significativo en cómo los usuarios interactúan con los feeds de video. Si un usuario está dispuesto a desplazarse hasta cierto punto, es más probable que interactúe con los items ubicados allí. Al usar datos recopilados de usuarios reales, podemos entender mejor estos patrones de desplazamiento y adaptar nuestras recomendaciones en consecuencia.
Datos y Metodología
Para construir y validar el modelo C-3PO, recolectamos datos de una importante plataforma de redes sociales. Observamos los comportamientos de desplazamiento de los usuarios, notando cuán lejos se desplazaron y con qué interactuaron. Al analizar un millón de sesiones de eventos de visualización de videos, pudimos ver patrones que emergen con el tiempo.
Queríamos comparar diferentes modelos para ver cuál predice el compromiso del usuario con más precisión. También incluimos métricas tradicionales de predicción del comportamiento del usuario en nuestras comparaciones. De este modo, pudimos ver si C-3PO superaba significativamente a los modelos anteriores.
Resultados
Cuando probamos nuestro nuevo modelo contra métodos tradicionales, encontramos que predecía el compromiso del usuario mucho mejor. Los hallazgos indicaron que nuestro modelo captura cuán lejos se desplazan los usuarios y en qué hacen clic significativamente más que los métodos comunes.
En esencia, C-3PO superó a otros modelos porque consideró la manera única en que los usuarios se comportan al desplazarse por los feeds. Mientras que los métodos tradicionales se centraron en clics, nuestro modelo capturó todo el comportamiento de desplazamiento, lo que llevó a mejores recomendaciones.
Implicaciones para los Sistemas de Recomendación
Estos resultados tienen implicaciones esenciales para cómo funcionan los sistemas de recomendación, particularmente en plataformas con feeds de desplazamiento interminable. C-3PO puede proporcionar una manera más precisa de medir el compromiso del usuario, lo cual es crítico para mejorar la satisfacción del usuario y los resultados comerciales.
Al adoptar un modelo que tiene en cuenta cómo los usuarios interactúan con el contenido, las empresas pueden adaptar mejor sus recomendaciones para satisfacer las necesidades del usuario. Esto puede llevar a un mayor compromiso del usuario, más tiempo en la plataforma y, en última instancia, un mejor rendimiento comercial.
Trabajo Futuro
El trabajo presentado aquí establece las bases para mejorar aún más los sistemas de recomendación. A futuro, planeamos explorar modelos incluso más complejos y adaptar C-3PO para diferentes tipos de contenido y plataformas.
Además, investigaremos cómo incorporar información contextual para afinar mejor nuestras estimaciones. Por ejemplo, entender el comportamiento del usuario según la hora del día, el dispositivo utilizado o incluso el estado emocional puede llevar a recomendaciones aún más personalizadas.
Conclusión
En conclusión, el modelo C-3PO representa un avance significativo en la mejora de las recomendaciones de videos en plataformas de redes sociales. Al centrarse en cómo los usuarios se desplazan en vez de simplemente en los clics, podemos ofrecer recomendaciones que realmente se alinean con el comportamiento del usuario. Este enfoque beneficia en última instancia tanto a los usuarios como a los negocios, allanando el camino para un mejor compromiso y satisfacción.
La creciente importancia de experiencias personalizadas en el espacio digital significa que modelos como C-3PO se volverán cada vez más valiosos. A medida que continuamos mejorando y probando nuestros enfoques, el potencial para mejorar las experiencias y resultados de los usuarios se vuelve más emocionante que nunca.
Título: A Probabilistic Position Bias Model for Short-Video Recommendation Feeds
Resumen: Modern web-based platforms show ranked lists of recommendations to users, attempting to maximise user satisfaction or business metrics. Typically, the goal of such systems boils down to maximising the exposure probability for items that are deemed "reward-maximising" according to a metric of interest. This general framing comprises streaming applications, as well as e-commerce or job recommendations, and even web search. Position bias or user models can be used to estimate exposure probabilities for each use-case, specifically tailored to how users interact with the presented rankings. A unifying factor in these diverse problem settings is that typically only one or several items will be engaged with (clicked, streamed,...) before a user leaves the ranked list. Short-video feeds on social media platforms diverge from this general framing in several ways, most notably that users do not tend to leave the feed after e.g. liking a post. Indeed, seemingly infinite feeds invite users to scroll further down the ranked list. For this reason, existing position bias or user models tend to fall short in such settings, as they do not accurately capture users' interaction modalities. In this work, we propose a novel and probabilistically sound personalised position bias model for feed recommendations. We focus on a 1st-level feed in a hierarchical structure, where users may enter a 2nd-level feed via any given 1st-level item. We posit that users come to the platform with a scrolling budget drawn according to some distribution, and show how the survival function of said distribution can be used to obtain closed-form estimates for personalised exposure probabilities. Empirical insights from a large-scale social media platform show how our probabilistic position bias model more accurately captures empirical exposure than existing models, and paves the way for unbiased evaluation and learning-to-rank.
Autores: Olivier Jeunen
Última actualización: 2023-07-26 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2307.14059
Fuente PDF: https://arxiv.org/pdf/2307.14059
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.