Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Recuperación de información

M2GNN: Un Nuevo Enfoque para Recomendaciones entre Dominios

M2GNN enfrenta la escasez de datos en recomendaciones usando etiquetas de manera efectiva.

― 6 minilectura


Recomendaciones deRecomendaciones deTransformaciones M2GNNen medio de la escasez de datos.Nuevo método mejora las recomendaciones
Tabla de contenidos

La recomendación cruzada ayuda a resolver el problema cuando no hay suficientes datos sobre usuarios o elementos en un área específica. Un enfoque efectivo es usar información textual. Sin embargo, todavía hay dos desafíos principales. Primero, muchos sistemas no tienen descripciones detalladas para los elementos y, en su mayoría, dependen de Etiquetas o tags cortos. Segundo, no todos los intereses de diferentes áreas son útiles para hacer recomendaciones en un área objetivo. Algunos intereses incluso pueden confundir las recomendaciones.

La Solución Propuesta

Para abordar estos problemas, se introduce un nuevo método llamado M2GNN. Significa Red Neuronal Agregada de Metapath y Multi-interés. Este sistema utiliza etiquetas para crear conexiones entre usuarios, elementos y etiquetas en diferentes dominios.

Construyendo una Red de Conexiones

El método construye una red que captura cómo los usuarios interactúan con los elementos y cómo las etiquetas se relacionan tanto con los usuarios como con los elementos. Cada dominio tiene sus rutas específicas que representan cómo las etiquetas y los usuarios están conectados. Esto ayuda a entender mejor las preferencias de los usuarios.

Aprendiendo Representaciones de Usuarios

M2GNN aprende las preferencias de los usuarios filtrando etiquetas menos importantes y enfocándose en las más relevantes. Esto se hace en dos pasos. El primer paso se enfoca en las etiquetas dentro del mismo dominio, mientras que el segundo paso mira cómo esas preferencias se pueden aplicar en diferentes dominios.

Desafíos en Dianping

Dianping es un servicio en línea en China donde los usuarios buscan servicios locales y escriben reseñas. Muchos usuarios son nuevos o no han interactuado mucho, creando un problema de escasez de datos. Para solucionar esto, el método M2GNN usa etiquetas que son más fáciles de reunir y analizar en comparación con descripciones detalladas.

Importancia de las Etiquetas

Las etiquetas son palabras clave que describen servicios o acciones. Por ejemplo, si un usuario busca un tipo específico de comida, las etiquetas asociadas ayudarán a sugerir reseñas relacionadas con esa búsqueda. El método cuenta cómo están vinculadas las etiquetas entre diferentes actividades, lo que permite recomendaciones más efectivas.

Análisis de Etiquetas

El método realiza un análisis para ver cómo diferentes etiquetas son beneficiosas para recomendar elementos. Examina qué etiquetas conectadas a búsquedas y consumo llevan a recomendaciones positivas en el dominio de reseñas.

Comportamiento del Usuario

Entender el comportamiento del usuario ayuda a determinar cómo los intereses pueden compartirse y modificarse en diferentes dominios. Históricamente, muchos métodos se enfocaron en cómo los intereses de los usuarios se transferían de un área a otra sin considerar el contenido en sí. M2GNN se destaca porque combina el comportamiento del usuario con la comprensión del contenido.

El Marco de M2GNN

El marco de M2GNN está construido para gestionar las relaciones complejas entre etiquetas, usuarios y servicios.

Creando un Grafo Basado en Etiquetas

Se forma un tipo especial de grafo utilizando las etiquetas para representar las relaciones en diferentes dominios. Cada dominio tiene sus tipos específicos de interacciones, y el grafo ayuda a visualizar estas conexiones.

Importancia de la Agregación

Para entender las relaciones, M2GNN utiliza un proceso de agregación en dos pasos. El primer paso observa la información relevante dentro del mismo dominio, y el segundo paso analiza cómo esta información se puede compartir entre diferentes dominios.

Experimentos y Resultados

M2GNN fue probado en varios experimentos para analizar su efectividad en comparación con métodos anteriores.

Conjuntos de Datos Utilizados

Se utilizaron dos conjuntos de datos para las pruebas. El primero fue un conjunto de datos industrial creado específicamente llamado DPBJ, enfocado en datos de Dianping. El segundo conjunto de datos fue uno disponible públicamente de Amazon que también trataba sobre reseñas.

Comparación de Rendimiento

Los resultados mostraron que M2GNN superó consistentemente a los métodos existentes en varios aspectos. El método no solo proporcionó mejores recomendaciones, sino que también mejoró las experiencias de los usuarios que tenían interacciones limitadas.

Impacto en Usuarios en Frío

Un hallazgo significativo fue cómo M2GNN ayudó a los usuarios en frío. Muchos sistemas de recomendación tienen problemas con usuarios que no tienen actividad previa. M2GNN demostró que podía ayudar a estos usuarios aprovechando datos de otros dominios.

Pruebas en Línea

Se realizó una prueba en línea durante un período de dos semanas utilizando M2GNN dentro de la app de Dianping. El objetivo era comparar su efectividad con los sistemas existentes.

Métricas para Evaluación

Se utilizaron tres métricas clave para evaluar el rendimiento: número total de reseñas recolectadas, reseñas recolectadas por usuario y la tasa general de recolección.

Resultados Positivos

Los resultados indicaron mejoras sustanciales en las tres métricas, especialmente para usuarios inactivos y en frío. Esto destacó la capacidad de M2GNN para abordar efectivamente el problema de escasez de datos.

Entendiendo las Preferencias del usuario

M2GNN también ofreció información sobre las preferencias del usuario a través de su enfoque basado en etiquetas. Al visualizar cómo se forman los intereses a partir de diferentes etiquetas, el método proporcionó más claridad sobre el comportamiento del usuario. Esto ayuda a crear una experiencia de recomendación más personalizada para los usuarios.

Agrupando Etiquetas

El sistema puede agrupar etiquetas según sus significados, lo que lleva a una mejor comprensión de los intereses del usuario. Por ejemplo, algunas etiquetas relacionadas con ciertas cocinas mostraron un patrón en las preferencias de los usuarios, indicando qué tipos de reseñas serían útiles para ellos.

Trabajo Futuro

Los investigadores planean mejorar aún más M2GNN, perfeccionando el filtro para etiquetas no útiles. Encontrar mejores métodos para muestrear nodos en GNN será un área de enfoque, con el objetivo de refinar cómo se procesa la información y mejorar las recomendaciones.

Conclusión

M2GNN es un avance prometedor en el campo de las recomendaciones cruzadas, especialmente para entornos donde los datos son escasos. Al utilizar etiquetas de manera efectiva, mejora la comprensión de los intereses y comportamientos de los usuarios, llevando a sistemas de recomendación mucho mejores. El éxito de este método muestra el potencial de integrar información de contenido con el comportamiento del usuario de una manera que beneficie tanto a los usuarios como a los proveedores de servicios.

Fuente original

Título: M2GNN: Metapath and Multi-interest Aggregated Graph Neural Network for Tag-based Cross-domain Recommendation

Resumen: Cross-domain recommendation (CDR) is an effective way to alleviate the data sparsity problem. Content-based CDR is one of the most promising branches since most kinds of products can be described by a piece of text, especially when cold-start users or items have few interactions. However, two vital issues are still under-explored: (1) From the content modeling perspective, sufficient long-text descriptions are usually scarce in a real recommender system, more often the light-weight textual features, such as a few keywords or tags, are more accessible, which is improperly modeled by existing methods. (2) From the CDR perspective, not all inter-domain interests are helpful to infer intra-domain interests. Caused by domain-specific features, there are part of signals benefiting for recommendation in the source domain but harmful for that in the target domain. Therefore, how to distill useful interests is crucial. To tackle the above two problems, we propose a metapath and multi-interest aggregated graph neural network (M2GNN). Specifically, to model the tag-based contents, we construct a heterogeneous information network to hold the semantic relatedness between users, items, and tags in all domains. The metapath schema is predefined according to domain-specific knowledge, with one metapath for one domain. User representations are learned by GNN with a hierarchical aggregation framework, where the intra-metapath aggregation firstly filters out trivial tags and the inter-metapath aggregation further filters out useless interests. Offline experiments and online A/B tests demonstrate that M2GNN achieves significant improvements over the state-of-the-art methods and current industrial recommender system in Dianping, respectively. Further analysis shows that M2GNN offers an interpretable recommendation.

Autores: Zepeng Huai, Yuji Yang, Mengdi Zhang, Zhongyi Zhang, Yichun Li, Wei Wu

Última actualización: 2023-04-16 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2304.07911

Fuente PDF: https://arxiv.org/pdf/2304.07911

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares