Simple Science

Ciência de ponta explicada de forma simples

# Informática# Recuperação de informação

Abordando o viés de duração nas recomendações de vídeo

Um novo modelo melhora as previsões de interesse dos usuários para conteúdo em vídeo.

― 8 min ler


Corrigindo Falhas nasCorrigindo Falhas nasRecomendações de Vídeointeresses dos usuários em vídeos.Novo modelo melhora as previsões dos
Índice

As plataformas de conteúdo em vídeo se tornaram uma parte essencial da nossa rotina, atraindo milhões de usuários que curtem vários tipos de vídeos. Com a demanda por conteúdo personalizado aumentando, é fundamental desenvolver sistemas que ofereçam recomendações de vídeos relevantes, adaptadas aos interesses de cada um. Uma das formas de medir o Interesse do Usuário em vídeos é pelo tempo de exibição, que é o período que os usuários passam assistindo a determinados vídeos.

Mas prever o tempo de exibição pode ser enganoso por causa de um fenômeno chamado viés de duração. Esse viés acontece quando o tamanho do vídeo influencia o tempo assistido, levando a reflexões inprecisas sobre o interesse do usuário. Por exemplo, os usuários podem passar mais tempo assistindo a vídeos mais longos, não necessariamente porque estão mais interessados neles, mas simplesmente porque demoram mais para assistir.

Para criar melhores recomendações que realmente refletem as preferências do usuário, é vital entender e lidar com esse viés de duração.

O Problema do Viés de Duração

O viés de duração prejudica a eficácia das recomendações de vídeo. Os métodos atuais que tentam corrigir esse viés geralmente tratam todos os vídeos que são assistidos até o final como indicadores de alto interesse. No entanto, dados do mundo real mostram que o engajamento do usuário varia bastante, mesmo entre vídeos que foram completamente assistidos. Alguns usuários podem ficar satisfeitos com vídeos mais curtos, enquanto outros podem se sentir insatisfeitos, mesmo que ambos tenham assistido os vídeos até o final. Essa discrepância pode levar a suposições erradas sobre o interesse do usuário, baseadas apenas no tempo de exibição.

Para ilustrar isso melhor, pense em dois usuários que assistem completamente ao mesmo vídeo. O Usuário A pode se sentir contente depois de assistir a um vídeo de 30 segundos, enquanto o Usuário B pode achar que o mesmo vídeo não atendeu totalmente às suas necessidades. Se ambos forem tratados igualmente em termos de interesse só porque terminaram o vídeo, o sistema de recomendação falha em captar seus diferentes níveis de satisfação.

Tempo de Exibição Contrafactual

Para lidar com a questão do viés de duração, proponho um novo conceito chamado tempo de exibição contrafactual (CWT). Esse conceito se refere ao tempo de exibição hipotético que os usuários teriam se a duração do vídeo fosse suficientemente longa. Em outras palavras, o CWT representa o tempo que os usuários idealmente gostariam de passar assistindo a um vídeo, com base em seus verdadeiros interesses, sem serem limitados pela duração real do vídeo.

O CWT ajuda a esclarecer as preferências dos usuários porque considera a possibilidade de que um usuário possa querer assistir por mais tempo do que realmente o fez. Isso cria uma compreensão mais sutil do interesse do usuário, especialmente para vídeos que foram assistidos até o final. A ideia é extrair insights sobre as preferências do usuário a partir do contexto de quanto tempo eles gastariam assistindo se o vídeo fosse mais longo.

Modelando o Tempo de Exibição Contrafactual

Para modelar efetivamente o CWT e estimar o interesse do usuário, apresentamos uma nova abordagem chamada Modelo de Tempo de Exibição Contrafactual (CWM). Essa abordagem trata o comportamento de visualização do usuário de uma forma semelhante à tomada de decisões econômicas. Os usuários basicamente pesam o prazer que obtêm assistindo a um vídeo contra o custo do seu tempo.

Essencialmente, o modelo postula que os usuários continuarão assistindo a um vídeo até que o prazer obtido com a visualização adicional não seja mais maior do que o custo desse tempo. O ponto em que um usuário decide parar de assistir pode ser entendido como seu CWT.

Além disso, introduzimos uma função de transformação que converte o CWT em uma estimativa do interesse do usuário. Isso nos permite criar uma pontuação de interesse do usuário com base no tempo de exibição potencial, em vez de apenas no tempo que realmente assistiram.

Evidências que Apoiam o CWT

O conceito de CWT é apoiado por observações de conjuntos de dados de recomendações de vídeos do mundo real. Ao analisar o comportamento do usuário, dois fenômenos notáveis emergem:

  1. Visualizações Repetidas: Os usuários muitas vezes assistem a vídeos várias vezes, indicando um alto nível de interesse. No entanto, esse engajamento repetido geralmente ocorre quando os usuários sentem que o vídeo não satisfaz completamente suas necessidades, sugerindo a truncagem do seu CWT.

  2. Distribuição Bimodal do Tempo de Exibição: Ao analisar a distribuição dos tempos de exibição para o mesmo vídeo, frequentemente podem ser vistas duas grupos distintos: usuários que pulam partes do vídeo e aqueles que assistem completamente. Essa distribuição bimodal sugere que os tempos de exibição não estão uniformemente distribuídos, afirmando ainda mais que os métodos tradicionais falham em captar a complexidade do interesse do usuário.

Ao integrar o CWT em nossos sistemas de recomendação, podemos desenvolver uma compreensão mais clara dos desejos e interesses dos usuários em relação ao conteúdo em vídeo.

Vantagens do Modelo de Tempo de Exibição Contrafactual

O CWM oferece várias vantagens em relação aos métodos existentes que visam corrigir o viés de duração. Ao mudar o foco dos tempos de exibição observados para um modelo mais abrangente que inclui as preferências do usuário, o CWM fornece uma representação mais precisa do interesse do usuário.

Um dos principais benefícios de usar o CWM é sua capacidade de alinhar os interesses dos usuários mais de perto com suas verdadeiras preferências. Isso leva a recomendações melhores que combinam mais com as expectativas dos usuários.

Além disso, o CWM permite a estimativa simultânea do tempo de exibição e do interesse do usuário. Métodos tradicionais geralmente têm dificuldade em alcançar esse objetivo duplo de maneira eficaz; eles podem enfatizar um em detrimento do outro. No entanto, ao adotar uma estrutura que verdadeiramente reflete o engajamento do usuário, o CWM garante que ambos os aspectos sejam respeitados e captados com precisão.

Sucesso Empírico

Para validar nossa abordagem, foram realizados amplos experimentos usando conjuntos de dados do mundo real. Esses experimentos revelaram que o CWM superou os métodos existentes, especialmente em cenários onde o viés de duração era mais severo.

Os resultados demonstraram uma precisão aprimorada na previsão do tempo de exibição e na oferta de recomendações de vídeos relevantes com base no interesse do usuário. Notavelmente, o CWM mostrou um desempenho notável mesmo em conjuntos de dados com uma alta porcentagem de vídeos completamente assistidos, onde outras abordagens tiveram dificuldades.

Além disso, testes A/B online confirmaram os benefícios práticos do CWM em recomendações do mundo real. Os usuários relataram um tempo médio de exibição maior quando as recomendações foram geradas usando o CWM, indicando uma maior satisfação do usuário.

Conclusão

Para concluir, o desafio do viés de duração é significativo nos sistemas de recomendação de vídeo. Ao introduzir o conceito de tempo de exibição contrafactual e desenvolver o Modelo de Tempo de Exibição Contrafactual, criamos uma estrutura mais eficaz para entender e prever os interesses dos usuários.

Essa abordagem não só melhora a precisão das recomendações de vídeo, mas também leva a uma maior satisfação do usuário ao alinhar o conteúdo mais de perto com as preferências do usuário. À medida que o consumo de vídeos continua a crescer, implementar modelos como o CWM será essencial para garantir que os usuários recebam conteúdo relevante e envolvente, adaptado aos seus verdadeiros interesses.

Os resultados dos nossos experimentos destacam o potencial do CWM para transformar a forma como abordamos as recomendações de vídeos. Ao focar nos interesses dos usuários de maneira mais profunda, podemos avançar em direção à criação de sistemas que beneficiem tanto os usuários quanto as plataformas de conteúdo.

Fonte original

Título: Counteracting Duration Bias in Video Recommendation via Counterfactual Watch Time

Resumo: In video recommendation, an ongoing effort is to satisfy users' personalized information needs by leveraging their logged watch time. However, watch time prediction suffers from duration bias, hindering its ability to reflect users' interests accurately. Existing label-correction approaches attempt to uncover user interests through grouping and normalizing observed watch time according to video duration. Although effective to some extent, we found that these approaches regard completely played records (i.e., a user watches the entire video) as equally high interest, which deviates from what we observed on real datasets: users have varied explicit feedback proportion when completely playing videos. In this paper, we introduce the counterfactual watch time(CWT), the potential watch time a user would spend on the video if its duration is sufficiently long. Analysis shows that the duration bias is caused by the truncation of CWT due to the video duration limitation, which usually occurs on those completely played records. Besides, a Counterfactual Watch Model (CWM) is proposed, revealing that CWT equals the time users get the maximum benefit from video recommender systems. Moreover, a cost-based transform function is defined to transform the CWT into the estimation of user interest, and the model can be learned by optimizing a counterfactual likelihood function defined over observed user watch times. Extensive experiments on three real video recommendation datasets and online A/B testing demonstrated that CWM effectively enhanced video recommendation accuracy and counteracted the duration bias.

Autores: Haiyuan Zhao, Guohao Cai, Jieming Zhu, Zhenhua Dong, Jun Xu, Ji-Rong Wen

Última atualização: 2024-06-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2406.07932

Fonte PDF: https://arxiv.org/pdf/2406.07932

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes