Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Recuperación de información

Mejorando las recomendaciones con aumento de ítems positivos

Un nuevo método mejora la precisión y variedad de los sistemas de recomendación.

― 6 minilectura


Mejorando la Precisión deMejorando la Precisión delas Recomendacionesvariadas.del usuario a través de recomendacionesUn nuevo enfoque mejora la interacción
Tabla de contenidos

Los sistemas de recomendaciones personalizadas ayudan a los usuarios a encontrar cosas que probablemente les gusten basándose en su comportamiento pasado. Sin embargo, un problema común que enfrentan estos sistemas es la falta de datos suficientes. Muchos usuarios pueden no interactuar con suficientes elementos para que el sistema entienda con precisión sus preferencias. Esto lleva a recomendaciones malas, ya que el sistema lucha por identificar lo que quieren los usuarios.

Para mejorar las recomendaciones, es importante crear ejemplos adicionales positivos de elementos que a los usuarios les podrían gustar. Esto se conoce como aumento de elementos positivos. Sin embargo, simplemente agregar más elementos no es suficiente. El sistema debe asegurarse de que estos elementos añadidos sean tanto precisos como variados para evitar mostrar a los usuarios los mismos tipos de contenido una y otra vez.

El Problema de la Escasez de datos

En muchos sistemas de recomendación, los usuarios tienen historiales de clics, compras o vistas que son mínimos en comparación con la gran cantidad de elementos disponibles. Por ejemplo, considera la cantidad de elementos que hay en plataformas como servicios de streaming o sitios de e-commerce. Los usuarios pueden haber interactuado solo con un puñado de estos elementos, lo que lleva a una comprensión escasa de sus verdaderas preferencias. Esta escasez de datos dificulta que los algoritmos de recomendación identifiquen lo que les interesa a los usuarios.

Para combatir este problema, muchos investigadores han buscado varios métodos para aumentar la cantidad de retroalimentación positiva utilizada para el entrenamiento. Algunos enfoques recopilan información de diferentes fuentes o incluso consideran el comportamiento de usuarios con intereses similares. Otro método es crear nuevos ejemplos dentro del mismo conjunto de datos para mejorar el entrenamiento sin necesidad de información externa.

Enfoque para el Aumento de Elementos Positivos

El método propuesto se centra en crear un conjunto más preciso y variado de ejemplos de elementos positivos. Esto implica recopilar elementos potenciales desde múltiples perspectivas. Primero, el sistema analiza los comportamientos pasados de un usuario para reunir elementos que se alineen tanto con sus intereses a largo plazo como a corto plazo. Esto se hace a través de tres estrategias principales:

  1. Recuperación de Usuario a Elemento (u2i): Esta estrategia reúne elementos basándose en los intereses generales de un usuario, considerando su comportamiento a largo plazo.
  2. Recuperación de Elemento a Elemento (i2i): Este método se centra en los intereses inmediatos del usuario ligados directamente a los elementos con los que han interactuado.
  3. Recuperación de Usuario a Usuario a Elemento (u2u2i): Esta estrategia observa lo que usuarios similares han gustado y recomienda esos elementos.

Una vez que se han recopilado estos elementos positivos potenciales, el sistema emplea un método conocido como auto-destilación. Esto es una forma de revisar y refinar los elementos seleccionados, asegurando que sean de alta calidad y lo suficientemente diversos como para satisfacer diferentes gustos de los usuarios.

Mejorando las Recomendaciones

El objetivo es hacer que las recomendaciones sean más precisas y diversas. Cuando se introducen nuevos elementos positivos en el proceso de entrenamiento, deberían ayudar al modelo a aprender mejor. Recomendaciones diversas pueden mantener a los usuarios enganchados y evitar que se queden atrapados en un bucle de ver los mismos tipos de contenido.

Para medir la efectividad del sistema propuesto, los investigadores realizaron pruebas tanto en modo offline (utilizando datos históricos) como online (en escenarios del mundo real). Esto incluyó una prueba A/B donde el nuevo sistema se comparó con métodos existentes para ver si realmente ofrecía mejores recomendaciones.

Experimentación y Resultados

En las evaluaciones, el sistema propuesto mostró mejoras notables sobre los métodos existentes. La investigación se realizó utilizando dos grandes conjuntos de datos. El primero consistió en millones de usuarios y elementos, lo que permitió pruebas precisas en un escenario del mundo real.

En estos experimentos, se rastrearon medidas como la frecuencia con la que los usuarios hicieron clic en elementos recomendados (tasa de clics) y la satisfacción general del usuario. Los resultados demostraron que el nuevo método podía aumentar la cantidad de interacciones positivas, mostrando que los usuarios eran más propensos a interactuar con los elementos sugeridos.

Al aprovechar las tres estrategias de recuperación, el sistema pudo reunir una amplia variedad de recomendaciones. Los resultados indicaron que los usuarios recibieron un conjunto más diverso de sugerencias en comparación con los métodos tradicionales, que se basaban principalmente en lo que los usuarios habían interactuado previamente.

Pruebas Online

Para confirmar la efectividad del método, se realizó una prueba A/B en línea. En esta prueba, se implementó el nuevo sistema de recomendaciones, permitiendo que usuarios reales experimentaran los cambios. El rendimiento se evaluó rastreando dos métricas principales: el promedio de números de reproducciones per cápita y la tasa de finalización de videos.

Los resultados fueron prometedores. Cuando el sistema tradicional fue reemplazado por el nuevo método, se registraron mejoras significativas en ambas métricas. Esto indicó que los usuarios no solo estaban encontrando más cosas para ver, sino que también estaban permaneciendo más tiempo con el contenido.

Entendiendo la Diversidad en las Recomendaciones

La diversidad en las recomendaciones es vital. Esto ayuda a prevenir lo que se conoce como "burbujas de filtro", donde los usuarios solo ven un rango estrecho de contenido que ya conocen y les gusta. El nuevo método mostró que podía ofrecer una variedad más amplia de elementos a los usuarios. Esto se validó analizando cuántos elementos distintos se recomendaron en comparación con el método tradicional.

Al evaluar la distinción en las recomendaciones, estaba claro que el nuevo enfoque proporcionaba más de tres veces la cantidad de elementos únicos para que los usuarios consideraran. Esta variedad puede mejorar la experiencia del usuario y mantener altos los niveles de participación.

Conclusión y Direcciones Futuras

El aumento de elementos positivos es una parte esencial para mejorar los sistemas de recomendación. Al combinar métodos para reunir un conjunto diverso de recomendaciones potenciales y refinarlas a través de la auto-destilación, este nuevo enfoque ha demostrado ser efectivo.

La implementación de este método en sistemas del mundo real indica su valor práctico, impactando a un gran número de usuarios. El trabajo futuro se centrará en crear aún más formas de mejorar las recomendaciones de elementos positivos y analizar cómo diferentes ajustes pueden beneficiar aún más a los usuarios.

Al enfocarse en mejorar tanto la precisión como la diversidad, el objetivo es crear un sistema de recomendaciones que realmente entienda y atienda las preferencias individuales de los usuarios, asegurando que sigan comprometidos y satisfechos con el contenido que reciben.

Fuente original

Título: Learning from All Sides: Diversified Positive Augmentation via Self-distillation in Recommendation

Resumen: Personalized recommendation relies on user historical behaviors to provide user-interested items, and thus seriously struggles with the data sparsity issue. A powerful positive item augmentation is beneficial to address the sparsity issue, while few works could jointly consider both the accuracy and diversity of these augmented training labels. In this work, we propose a novel model-agnostic Diversified self-distillation guided positive augmentation (DivSPA) for accurate and diverse positive item augmentations. Specifically, DivSPA first conducts three types of retrieval strategies to collect high-quality and diverse positive item candidates according to users' overall interests, short-term intentions, and similar users. Next, a self-distillation module is conducted to double-check and rerank these candidates as the final positive augmentations. Extensive offline and online evaluations verify the effectiveness of our proposed DivSPA on both accuracy and diversity. DivSPA is simple and effective, which could be conveniently adapted to other base models and systems. Currently, DivSPA has been deployed on multiple widely-used real-world recommender systems.

Autores: Chong Liu, Xiaoyang Liu, Ruobing Xie, Lixin Zhang, Feng Xia, Leyu Lin

Última actualización: 2023-08-15 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2308.07629

Fuente PDF: https://arxiv.org/pdf/2308.07629

Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares