Recomendações Personalizadas com IA Generativa
Um novo sistema pra personalizar itens gerados com base no que o usuário quer.
― 5 min ler
Índice
Sistemas de recomendação são feitos pra ajudar os usuários a encontrar itens que combinem com seus interesses. Isso pode incluir vídeos, produtos ou artigos. Geralmente, esses sistemas trabalham com um conjunto fixo de itens que já estão disponíveis. Recentemente, os avanços em IA generativa tornaram possível criar novos itens com base em inputs dos usuários, em vez de só buscar os que já existem. Isso traz um novo desafio: como podemos personalizar esses itens gerados pra cada usuário quando pode ter um número infinito de opções?
Esse artigo discute uma estrutura pra enfrentar esse desafio, focando em como conectar melhor os usuários com os itens que eles querem usando prompts, ou solicitações específicas dos usuários, pra buscar modelos que geram saídas personalizadas. No nosso estudo, apresentamos um novo conjunto de dados contendo milhares de imagens geradas por vários modelos usando diferentes prompts e explicamos como podemos classificar esses itens gerados pra combinar melhor com as preferências dos usuários.
Personalização
O Desafio daPersonalização em recomendações generativas significa entender o que cada usuário gosta. Mas, com muitos modelos generativos disponíveis, não faz sentido os usuários conferirem cada opção uma a uma. Em vez disso, proponho uma solução que primeiro filtra os modelos com base nos prompts e preferências dos usuários. Esse processo tem duas etapas principais: buscar modelos relevantes com base nos prompts dados e classificar os itens gerados por esses modelos.
Visão Geral da Estrutura
A estrutura que propomos inclui duas etapas principais:
Busca de Prompt-Modelo: Nessa etapa, identificamos quais modelos generativos são mais relevantes pro prompt do usuário. Usando um conjunto fixo de prompts variados, conseguimos avaliar visualmente como diferentes modelos se saem.
Classificação dos Itens Gerados: Depois de filtrar as opções, focamos em classificar os itens gerados por esses modelos selecionados com base no feedback dos usuários. Esse feedback dá uma visão das preferências dos usuários.
O Conjunto de Dados GEMRec-18K
Pra apoiar nossa estrutura, criamos um conjunto de dados chamado GEMRec-18K. Ele consiste em 18.000 imagens geradas usando 200 modelos generativos diferentes emparelhados com 90 prompts diversos. Esse conjunto de dados é essencial pra melhorar os sistemas de recomendação generativa, já que nos permite analisar como diferentes modelos respondem a vários pedidos. Os prompts foram coletados de várias fontes pra garantir que cobrissem uma ampla gama de temas e estilos.
Importância da Interação do Usuário
Um sistema de recomendação eficaz deve facilitar a interação do usuário. A estrutura proposta permite que os usuários vejam e avaliem as imagens geradas por meio de uma interface interativa. Fazendo isso, os usuários podem expressar o que gostam ou não, permitindo que o sistema aprenda e melhore com o tempo. A primeira etapa, Busca de Prompt-Modelo, deixa os usuários compararem saídas de diferentes modelos. A segunda etapa, Classificação dos Itens Gerados, permite que os usuários organizem as imagens com base em suas preferências, dando um feedback valioso pra ajudar a refinar as recomendações futuras.
Explorando Imagens Geradas
Analisamos a variedade e qualidade das imagens criadas por diferentes modelos. Observando as diferenças entre as imagens geradas para o mesmo prompt, conseguimos ver quão únicas ou similares são as saídas. Essa análise ajuda a entender quais modelos produzem resultados diversos e quais tendem a gerar imagens semelhantes.
Limitações das Métricas Atuais
Avaliar a eficácia dos modelos generativos não é simples. As métricas atuais geralmente focam em popularidade ou precisão, mas só isso não dá uma visão completa. Modelos populares podem dar resultados parecidos, o que pode limitar a diversidade. Portanto, precisamos de uma métrica mais abrangente que avalie não só a qualidade das imagens geradas, mas também sua variedade.
Avaliando com uma Nova Métrica
Pra lidar com as limitações das técnicas de avaliação existentes, apresentamos uma nova métrica chamada Generative Recommendation Evaluation Score (GRE-Score). Essa pontuação leva em consideração diversos fatores, incluindo o quão bem as imagens geradas combinam com os prompts e a diversidade das saídas. Com essa nova métrica, conseguimos fornecer uma avaliação mais completa do desempenho de cada modelo.
Direções Futuras
Nossos achados abrem caminho pra várias oportunidades de pesquisa no futuro. Uma direção é expandir o conjunto de dados GEMRec incluindo ainda mais prompts e modelos. Isso vai melhorar o aspecto de personalização da nossa estrutura. Além disso, pretendemos realizar estudos com usuários pra ver como eles interagem com nosso sistema e coletar dados pra refinar ainda mais as recomendações dos modelos.
Outra parte importante é estabelecer métodos de avaliação padronizados para recomendações generativas. Entender as preferências individuais é fundamental, e precisamos desenvolver métricas que reflitam com precisão os gostos dos usuários. Por fim, enquanto nosso estudo se concentra na geração de imagens, acreditamos que os princípios podem ser aplicados a outras áreas, como geração de texto ou música.
Conclusão
A integração de IA generativa em sistemas de recomendação apresenta novas possibilidades empolgantes para recomendações personalizadas. Ao propor uma estrutura organizada que incorpora feedback dos usuários e métricas de avaliação inovadoras, podemos melhorar a experiência do usuário ao explorar itens gerados. Nosso trabalho serve como um ponto de partida na contínua jornada pra criar sistemas de recomendação generativa mais eficazes e personalizados.
Título: GEMRec: Towards Generative Model Recommendation
Resumo: Recommender Systems are built to retrieve relevant items to satisfy users' information needs. The candidate corpus usually consists of a finite set of items that are ready to be served, such as videos, products, or articles. With recent advances in Generative AI such as GPT and Diffusion models, a new form of recommendation task is yet to be explored where items are to be created by generative models with personalized prompts. Taking image generation as an example, with a single prompt from the user and access to a generative model, it is possible to generate hundreds of new images in a few minutes. How shall we attain personalization in the presence of "infinite" items? In this preliminary study, we propose a two-stage framework, namely Prompt-Model Retrieval and Generated Item Ranking, to approach this new task formulation. We release GEMRec-18K, a prompt-model interaction dataset with 18K images generated by 200 publicly-available generative models paired with a diverse set of 90 textual prompts. Our findings demonstrate the promise of generative model recommendation as a novel personalization problem and the limitations of existing evaluation metrics. We highlight future directions for the RecSys community to advance towards generative recommender systems. Our code and dataset are available at https://github.com/MAPS-research/GEMRec.
Autores: Yuanhe Guo, Haoming Liu, Hongyi Wen
Última atualização: 2023-12-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2308.02205
Fonte PDF: https://arxiv.org/pdf/2308.02205
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://huggingface.co/models?pipeline
- https://midjourney.com
- https://civitai.com
- https://github.com/civitai/civitai/wiki/REST-API-Reference
- https://huggingface.co/docs/diffusers/api/pipelines/overview
- https://beta.dreamstudio.ai/prompt-guide
- https://docs.midjourney.com/docs/prompts
- https://github.com/MAPS-research/GEMRec
- https://dl.acm.org/ccs.cfm