Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem

Melhorando a Classificação de Intenções em Sistemas de Diálogo

Um novo método melhora a identificação de intenções conhecidas e desconhecidas dos usuários em chatbots.

― 6 min ler


Melhorando o DesempenhoMelhorando o Desempenhodo Sistema de Diálogode intenções em chatbots.Um método pra melhorar a classificação
Índice

A classificação de intenções abertas é uma tarefa importante em sistemas de diálogo, que são usados em chatbots e assistentes virtuais. Essa tarefa envolve identificar com precisão intenções conhecidas dos usuários-como reservar um voo ou conferir a previsão do tempo-enquanto também detecta novas intenções desconhecidas que o sistema ainda não viu. O desafio é melhorar a capacidade do sistema de reconhecer essas intenções desconhecidas sem cometer erros.

Neste artigo, discutimos um novo método projetado para melhorar a classificação de intenções abertas. Esse método consiste em duas partes principais: aprender a representar efetivamente as características das intenções e ajustar a fronteira de decisão para identificar intenções conhecidas e desconhecidas com mais precisão.

O Desafio da Classificação de Intenções Abertas

A classificação de intenções abertas lida com uma mistura de intenções conhecidas e desconhecidas. As intenções conhecidas são aquelas que o sistema já aprendeu, enquanto as intenções desconhecidas são novas e inesperadas. A capacidade de reconhecer essas intenções desconhecidas pode levar a uma melhor satisfação do usuário, já que diminui as chances de o sistema fazer palpites errados.

Métodos tradicionais de classificação de intenções têm se concentrado principalmente nas intenções conhecidas. Como resultado, muitos modelos não conseguem lidar com novas intenções que surgem nas interações do dia a dia. Para resolver isso, pesquisadores exploraram várias estratégias, mas ainda existem vários desafios, como lidar com dados de treinamento ruidosos ou desequilibrados e aprender de forma eficaz as fronteiras de decisão que separam intenções conhecidas das desconhecidas.

Nossa Abordagem

Para enfrentar esses desafios, apresentamos um método que consiste em dois componentes principais: aprendizado contrastivo K-center e aprendizado de fronteira de decisão ajustável.

Aprendizado Contrastivo K-Center

Na primeira parte da nossa abordagem, implementamos o aprendizado contrastivo K-center. Esse método ajuda a criar melhores representações das características das intenções. O objetivo é aproximar intenções similares e afastar intenções diferentes no espaço de características. Isso resulta em distinções mais claras entre as intenções conhecidas, facilitando seu reconhecimento.

Em vez de tratar todas as amostras positivas igualmente, nosso método foca em como cada amostra positiva se relaciona com outras dentro da mesma classe de intenção. Assim, garantimos que amostras similares se agrupem e formem centros bem definidos. Essa representação aprimorada leva a uma melhor generalização, significando que o modelo se sai bem mesmo ao encontrar intenções desconhecidas.

Aprendizado de Fronteira de Decisão Ajustável

A segunda parte da nossa abordagem é o aprendizado de fronteira de decisão ajustável. Esse método foca em estabelecer limites claros para o que constitui intenções conhecidas e desconhecidas. Aprender essas fronteiras é crucial porque elas determinam como o sistema toma decisões sobre novos inputs.

Em nosso método, estabelecemos um centro de decisão para cada intenção conhecida e definimos um raio em torno dele. Esse raio ajuda a distinguir entre as instâncias que pertencem à intenção conhecida e aquelas que caem na categoria desconhecida. Uma característica importante do nosso aprendizado de fronteira de decisão é que podemos ajustar o raio com base na distribuição das intenções conhecidas e desconhecidas. Se percebermos que há muitas intenções desconhecidas agrupadas perto da fronteira, podemos diminuir o raio para evitar má classificação. Por outro lado, se as intenções desconhecidas estiverem longe, podemos aumentar o raio para acomodar mais instâncias conhecidas.

Benefícios do Nosso Método

Ao combinar aprendizado contrastivo K-center e aprendizado de fronteira de decisão ajustável, conseguimos um desempenho melhor na classificação de intenções abertas. Nosso método mostrou vantagens distintas em reduzir erros com intenções desconhecidas enquanto mantém alta precisão com intenções conhecidas. Essa abordagem dupla possibilita que o sistema aprenda com seus erros e melhore continuamente seu processo de tomada de decisão.

Configuração Experimental

Para avaliar a eficácia do nosso método, conduzimos experimentos usando três conjuntos de dados bem conhecidos. Cada conjunto contém várias intenções que o sistema precisa aprender a reconhecer. O primeiro conjunto é relacionado a consultas bancárias, enquanto o segundo envolve classificação de intenções e previsões fora do escopo. Por fim, o terceiro conjunto é baseado em perguntas técnicas.

Nos nossos experimentos, variamos o número de intenções conhecidas presentes nos dados de treinamento. Testamos nosso modelo com combinações proporcionais de intenções conhecidas e desconhecidas para avaliar seu desempenho consistentemente. Adotamos métricas padrão, como precisão geral e F1 scores, para medir o sucesso do nosso método.

Resultados

Nossos experimentos geraram resultados promissores, demonstrando que nosso método superou abordagens existentes em classificação de intenções abertas. Os ganhos foram claros em todos os conjuntos de dados, mostrando que nossa técnica poderia melhorar significativamente a identificação de intenções conhecidas e desconhecidas.

Com nossa abordagem, notamos melhorias de vários pontos percentuais em relação aos métodos tradicionais, confirmando que nossas técnicas de aprendizado contrastivo K-center e de fronteira de decisão ajustável levaram a um sistema de classificação mais confiável.

Vantagens em Relação a Métodos Anteriores

Muitos métodos anteriores se concentraram principalmente em intenções conhecidas, sem abordar adequadamente o desafio das intenções desconhecidas. Nossa abordagem se destaca porque considera explicitamente ambas as categorias durante o treinamento. O processo de aprendizado dupla de representar intenções conhecidas e ajustar fronteiras nos permite melhorar não apenas a precisão da classificação, mas também a experiência geral do usuário.

Além disso, a capacidade do nosso modelo de adaptar as fronteiras de decisão com base na distância das intenções desconhecidas aumenta sua robustez. Essa adaptabilidade significa que o sistema é menos propenso a classificar incorretamente intenções desconhecidas, um problema comum em modelos existentes.

Conclusão

Em resumo, a classificação de intenções abertas é um desafio crítico em sistemas de diálogo, com implicações significativas para a satisfação do usuário e a eficácia do sistema. Nosso método proposto, combinando aprendizado contrastivo K-center e aprendizado de fronteira de decisão ajustável, demonstra um desempenho sólido na identificação precisa de intenções conhecidas e desconhecidas.

Nossos resultados mostram que essa abordagem dupla não apenas melhora o manejo das intenções desconhecidas, mas também aumenta a precisão geral da classificação, tornando-se uma contribuição valiosa para a área. À medida que os sistemas de diálogo se tornam mais comuns nas interações do dia a dia, a importância de desenvolver métodos de classificação robustos e adaptáveis continuará crescendo. Estamos ansiosos para ver como nossa abordagem pode ser ainda mais refinada e aplicada a outras tarefas de compreensão de linguagem natural no futuro.

Fonte original

Título: Effective Open Intent Classification with K-center Contrastive Learning and Adjustable Decision Boundary

Resumo: Open intent classification, which aims to correctly classify the known intents into their corresponding classes while identifying the new unknown (open) intents, is an essential but challenging task in dialogue systems. In this paper, we introduce novel K-center contrastive learning and adjustable decision boundary learning (CLAB) to improve the effectiveness of open intent classification. First, we pre-train a feature encoder on the labeled training instances, which transfers knowledge from known intents to unknown intents. Specifically, we devise a K-center contrastive learning algorithm to learn discriminative and balanced intent features, improving the generalization of the model for recognizing open intents. Second, we devise an adjustable decision boundary learning method with expanding and shrinking (ADBES) to determine the suitable decision conditions. Concretely, we learn a decision boundary for each known intent class, which consists of a decision center and the radius of the decision boundary. We then expand the radius of the decision boundary to accommodate more in-class instances if the out-of-class instances are far from the decision boundary; otherwise, we shrink the radius of the decision boundary. Extensive experiments on three benchmark datasets clearly demonstrate the effectiveness of our method for open intent classification. For reproducibility, we submit the code at: https://github.com/lxk00/CLAP

Autores: Xiaokang Liu, Jianquan Li, Jingjing Mu, Min Yang, Ruifeng Xu, Benyou Wang

Última atualização: 2023-04-20 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2304.10220

Fonte PDF: https://arxiv.org/pdf/2304.10220

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes