Modelo Inovador de Combinação de Múltiplas Intenções para Busca de Texto
Uma nova abordagem melhora a precisão da busca ao focar em atributos e nas intenções do usuário.
― 8 min ler
Índice
Sistemas de correspondência de texto são essenciais em várias plataformas de busca hoje em dia. Eles ajudam a combinar o que os usuários estão procurando com itens relevantes ou reformular consultas de usuários para resultados de busca melhores. Porém, as consultas dos usuários e os itens costumam ter vários Atributos, como categorias ou locais, que trazem informações importantes para a correspondência. Muitos modelos existentes não utilizam esses atributos de forma completa e os tratam como detalhes menores.
Esse trabalho tem como objetivo destacar a importância dos atributos, focando nas relações entre eles nas tarefas de correspondência. A gente apresenta uma nova abordagem que modela múltiplas intenções extraídas desses atributos, oferecendo uma compreensão mais refinada das necessidades dos usuários e das informações dos itens. Nossa estrutura proposta inclui três partes principais: um Codificador que considera os atributos, um modelo que extrai múltiplas intenções e um processo de correspondência que usa essas intenções.
A Importância da Correspondência de Texto
No mundo digital de hoje, os mecanismos de busca desempenham um papel crucial em guiar os usuários para as informações que eles procuram. Os motores de busca tradicionais se baseiam em índices construídos a partir de palavras-chave para encontrar documentos relevantes. Com a complexidade crescente das necessidades dos usuários e o conteúdo disponível, os sistemas modernos agora utilizam atributos para classificar e vincular consultas a itens.
Quando um usuário digita uma consulta, o sistema pode reconhecer os atributos relevantes e reformular a consulta para melhorar os resultados da busca. Por exemplo, na reformulação de consultas, um sistema pode aprimorar o pedido original com termos que têm melhor desempenho para obter resultados mais precisos.
Abordagens Atuais para Correspondência de Texto
Muitas estratégias foram implementadas para correspondência de texto em plataformas de busca. Recentemente, métodos de aprendizado profundo estão ganhando popularidade devido à sua capacidade de representar consultas e itens como vetores. Isso levou a melhorias nas relações entre diferentes aspectos do texto e atributos.
Embora vários estudos tenham destacado a importância dos atributos, eles costumam tratá-los como elementos secundários na representação geral do texto. No entanto, atributos são formas condensadas de informação que podem influenciar significativamente as tarefas de correspondência. É necessário explorar as conexões entre os atributos das consultas e dos itens relacionados.
Entendendo as Necessidades dos Usuários Através das Intenções
Quando os usuários fazem consultas, eles têm necessidades ou intenções específicas por trás delas. Compreender essas intenções pode melhorar muito o processo de correspondência. Por exemplo, se um usuário pesquisa “sapatos azuis baratos”, suas intenções podem incluir acessibilidade, cor e tipo de item. Ao entender essas intenções, o sistema pode alinhar melhor a consulta com os itens certos.
No entanto, os atributos nas consultas e itens muitas vezes não combinam em termos de tipo ou quantidade. Essa desconexão pode complicar a correspondência direta. Assim, propomos focar nas “intenções” como um conceito chave que reflete as Necessidades do Usuário de forma mais precisa do que apenas os atributos.
Na nossa abordagem, utilizamos uma estrutura que captura múltiplas intenções associadas tanto às consultas quanto aos seus atributos. Isso nos ajuda a criar uma representação mais detalhada das necessidades dos usuários e das características dos itens.
O Modelo de Correspondência Consciente de Múltiplas Intenções
Nosso método, chamado Modelo de Correspondência de Múltiplas Intenções (MIM), consiste em três componentes principais:
Codificador Consciente de Atributos
O codificador processa tanto a consulta quanto os atributos para entender seus significados juntos. Considerando a importância de vários atributos, implementamos um mecanismo de atenção que atribui diferentes pesos a eles, permitindo uma compreensão mais sutil de como cada atributo influencia o desempenho da correspondência.
Modelagem de Múltiplas Intenções
Uma vez que temos as representações codificadas, extraímos múltiplas intenções desses insumos. Esse passo é crucial, pois nos permite capturar as diferentes necessidades dos usuários ocultas dentro de uma única consulta. Ao tratar a consulta como um guia para extrair intenções, combinamos os atributos de forma eficaz e garantimos que a representação esteja alinhada com as intenções dos usuários.
Também introduzimos uma perda de distribuição que incentiva a diversidade entre as intenções aprendidas, garantindo que elas capturem várias perspectivas relacionadas à consulta. Isso é complementado por uma perda de divergência que alinha as representações de intenção tanto da consulta quanto dos itens que estão sendo correspondidos.
Correspondência Consciente de Intenções
Depois de extrair as intenções, combinamos elas com as representações textuais para calcular a pontuação final de correspondência. Utilizamos mecanismos de atenção novamente para incorporar informações de intenção no processo de avaliação. O modelo então gera uma pontuação de probabilidade indicando quão bem a consulta se emparelha com uma versão reformulada ou item.
Para refinar ainda mais esse processo, implementamos uma tarefa auto-supervisionada que identifica quais intenções desempenham um papel significativo no resultado da correspondência. Ao mascarar iterativamente cada intenção e observar as mudanças no desempenho, nosso modelo aprende a pesar a importância de cada intenção de forma apropriada.
Resultados Experimentais
Realizamos muitos experimentos para avaliar a eficácia do nosso método proposto em diferentes conjuntos de dados e cenários.
Conjuntos de Dados Usados
Fizemos experimentos offline usando três conjuntos de dados, incluindo um conjunto público e dois coletados de uma plataforma de e-commerce de grande escala. O primeiro conjunto envolveu a correspondência de consultas de usuários com itens relevantes. Extraímos frases-chave como atributos das consultas e incluímos vários detalhes como descrições e marcas dos itens.
O segundo conjunto focou na reformulação de consultas, onde coletamos registros de busca dos usuários e identificamos manualmente consultas de alta frequência. Cada consulta foi associada a atributos-chave, incluindo entidades e categorias, que ajudaram a definir melhor o contexto.
O terceiro conjunto foi estabelecido a partir de consultas para determinar a relevância dos itens com base no comportamento do usuário. Os atributos para itens incluíram palavras-chave e categorias, garantindo uma correspondência completa entre as necessidades dos usuários e os detalhes dos itens.
Avaliação de Desempenho Offline
Para a avaliação offline, comparamos nosso modelo com várias outras técnicas de correspondência de texto. Os resultados mostraram que nossa abordagem superou os modelos de referência em precisão, demonstrando a importância de usar efetivamente atributos e modelagem de intenções. Nosso modelo alcançou o melhor desempenho nos três conjuntos de dados, validando a eficiência e eficácia do nosso método.
Teste de Desempenho Online
Além dos testes offline, realizamos testes online A/B em uma aplicação do mundo real. Ao implantar nosso modelo em um sistema de busca utilizado por milhões de usuários, medimos o impacto em métricas comerciais. Os resultados indicaram melhorias significativas na satisfação dos usuários, destacando como nosso modelo melhora a experiência de busca.
Análise e Discussão
Nossa abordagem se destaca por empregar atributos como elementos centrais em vez de informações suplementares. Ao focar em múltiplas intenções informadas por esses atributos, proporcionamos um método mais abrangente para correspondência.
Contribuição de Cada Módulo
Realizamos uma análise dos diferentes componentes dentro do nosso modelo para discernir suas contribuições. Remover elementos críticos levou a quedas notáveis no desempenho. Isso indica que cada módulo desempenha um papel significativo em garantir a eficácia do nosso processo de correspondência.
Número de Intenções
Experimentamos com números variados de intenções para observar como elas afetam o desempenho. Foi descoberto que, embora adicionar intenções melhorasse os resultados inicialmente, há um ponto em que muitas intenções levam a retornos decrescentes. Esse insight pode ajudar a orientar trabalhos futuros na otimização da extração de intenções.
Importância dos Atributos
Também examinamos o papel de atributos individuais isolando-os e medindo o desempenho. Essa análise revelou que certos atributos, como localização, impactaram significativamente a eficácia geral do modelo. Entender quais atributos são mais importantes pode ajudar a ajustar futuros modelos para melhores resultados.
Conclusão
Apresentamos um modelo inovador para correspondência de texto com múltiplas intenções que foca tanto em atributos quanto nas necessidades dos usuários. Ao aproveitar as conexões entre atributos e intenções, nosso modelo melhora o desempenho de busca em vários cenários. Nossas extensas avaliações confirmam sua eficácia, com resultados positivos para milhões de usuários em uma aplicação do mundo real.
Em trabalhos futuros, pretendemos ampliar o escopo do nosso modelo para incluir correspondência multimodal, integrando diferentes tipos de dados para uma compreensão ainda mais rica das necessidades dos usuários. Isso abrirá caminho para soluções de busca mais inteligentes e eficazes no cenário digital.
Título: Multi-Intent Attribute-Aware Text Matching in Searching
Resumo: Text matching systems have become a fundamental service in most searching platforms. For instance, they are responsible for matching user queries to relevant candidate items, or rewriting the user-input query to a pre-selected high-performing one for a better search experience. In practice, both the queries and items often contain multiple attributes, such as the category of the item and the location mentioned in the query, which represent condensed key information that is helpful for matching. However, most of the existing works downplay the effectiveness of attributes by integrating them into text representations as supplementary information. Hence, in this work, we focus on exploring the relationship between the attributes from two sides. Since attributes from two ends are often not aligned in terms of number and type, we propose to exploit the benefit of attributes by multiple-intent modeling. The intents extracted from attributes summarize the diverse needs of queries and provide rich content of items, which are more refined and abstract, and can be aligned for paired inputs. Concretely, we propose a multi-intent attribute-aware matching model (MIM), which consists of three main components: attribute-aware encoder, multi-intent modeling, and intent-aware matching. In the attribute-aware encoder, the text and attributes are weighted and processed through a scaled attention mechanism with regard to the attributes' importance. Afterward, the multi-intent modeling extracts intents from two ends and aligns them. Herein, we come up with a distribution loss to ensure the learned intents are diverse but concentrated, and a kullback-leibler divergence loss that aligns the learned intents. Finally, in the intent-aware matching, the intents are evaluated by a self-supervised masking task, and then incorporated to output the final matching result.
Autores: Mingzhe Li, Xiuying Chen, Jing Xiang, Qishen Zhang, Changsheng Ma, Chenchen Dai, Jinxiong Chang, Zhongyi Liu, Guannan Zhang
Última atualização: 2024-02-12 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2402.07788
Fonte PDF: https://arxiv.org/pdf/2402.07788
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.