Simple Science

Ciência de ponta explicada de forma simples

# Informática# Inteligência Artificial

Facilitando o Teste de Aceitação do Usuário com o XUAT-Copilot

Automatizar o UAT pro WeChat Pay melhora a eficiência e reduz os erros.

― 6 min ler


Automatizando Testes doAutomatizando Testes doWeChat Paymais eficiente.XUAT-Copilot transforma o UAT pra ser
Índice

Os Testes de Aceitação do Usuário (UAT) são uma etapa chave no desenvolvimento de software. É a fase onde usuários reais testam o software pra ver se atende às suas necessidades. O principal objetivo do UAT é confirmar que o software se comporta como esperado em um cenário do dia a dia. Mas, o UAT tradicional geralmente exige muito esforço manual. Isso pode levar bastante tempo e tem uma chance maior de erros humanos.

Importância do WeChat Pay

O WeChat Pay é um dos maiores apps de pagamento móvel na China. Ele desempenha um papel enorme na vida diária de bilhões de usuários. Pra manter os usuários felizes, ele precisa funcionar perfeitamente o tempo todo. É por isso que o UAT é tão importante pro WeChat Pay. O objetivo é criar um sistema que torne o UAT mais fácil e menos trabalhoso.

O Desafio do UAT

No passado, o processo de UAT pro WeChat Pay envolvia criar casos de teste a partir dos requisitos de negócio. Esses eram então dados a testadores humanos, que tinham que escrever scripts pra rodar esses testes. Essa etapa exigia que os testadores tentassem várias ações no app pra garantir que os scripts funcionassem como deveriam. Como resultado, essa parte do processo podia levar muito tempo e era bem cansativa pros testadores.

Necessidade de Automação

Pra economizar tempo e esforço, o foco está em automatizar o processo de UAT. Automatizar o UAT significa usar tecnologia pra lidar com tarefas que geralmente precisam de esforço humano. Fazendo isso, conseguimos aumentar a eficiência e reduzir erros humanos.

Apresentando o XUAT-Copilot

Pra melhorar o UAT, desenvolvemos um sistema chamado XUAT-Copilot. Esse sistema usa grandes modelos de linguagem (LLMs), que são programas de computador avançados projetados pra entender e gerar texto parecido com o humano. O objetivo do XUAT-Copilot é criar scripts de teste automaticamente, tornando o processo de UAT mais rápido e fácil.

Estrutura do XUAT-Copilot

O XUAT-Copilot consiste em vários agentes, cada um responsável por uma tarefa diferente. Esses agentes trabalham juntos pra criar um processo de UAT mais eficiente. Os principais componentes do XUAT-Copilot incluem:

  1. Agente de Planejamento de Ação: Esse agente cria um plano das ações que precisam ser tomadas com base no caso de teste.
  2. Agente de Verificação de Estado: Esse agente verifica o status atual do app pra ver se as ações esperadas foram bem-sucedidas.
  3. Agente de Seleção de Parâmetros: Esse agente escolhe os parâmetros certos necessários pra executar as ações.
  4. Módulo de Sensoriamento de Estado: Esse módulo coleta informações da interface do usuário do app pra ajudar os agentes a tomarem decisões informadas.
  5. Módulo de Reescrita de Casos: Esse módulo torna os casos de teste originais mais claros pra que os agentes possam entendê-los melhor.

Como Funciona

O processo começa com requisitos de negócio que são transformados em fluxogramas de casos de teste. O sistema XUAT pega esses fluxogramas e gera casos de teste específicos. Esses casos são então reescritos pra serem mais compreensíveis pros agentes. As instruções reescritas são enviadas pro agente de planejamento de ação, que gera os comandos de ação.

Interação com o App

O sistema XUAT-Copilot envia comandos pra interagir com o app. Ele simula ações de usuários com base nos comandos gerados. O agente de verificação de estado então garante que essas ações tenham produzido os resultados esperados. Se surgirem problemas, os agentes vão ajustar suas ações de acordo.

Vantagens do XUAT-Copilot

Os testes realizados pelo XUAT-Copilot provaram ser quase tão eficazes quanto aqueles feitos por testadores humanos. O sistema reduz significativamente o tempo e o esforço necessários pro UAT, permitindo que as equipes se concentrem em outras tarefas importantes. Aqui estão alguns benefícios chave de usar o XUAT-Copilot:

  1. Aumento da Eficiência: A automação permite que os testes sejam concluídos em uma fração do tempo que levaria com testadores humanos.
  2. Redução de Erros: Sistemas automatizados têm menos chances de cometer erros em comparação com testadores humanos.
  3. Melhoria Contínua: O sistema pode aprender e melhorar com os testes passados, tornando-se mais eficaz ao longo do tempo.
  4. Economia de Custos: Ao economizar tempo e reduzir o esforço manual, o custo geral do UAT diminui.

O Papel dos Grandes Modelos de Linguagem

Os grandes modelos de linguagem são uma parte central do sistema XUAT-Copilot. Eles são treinados em grandes quantidades de dados textuais pra entender e gerar linguagem humana. Isso permite que os agentes se comuniquem e respondam efetivamente a instruções complexas.

Como os LLMs Melhoram o UAT

Os LLMs ajudam de várias maneiras:

  1. Processamento de Linguagem Natural: Eles conseguem entender instruções de linguagem complexas, facilitando o trabalho com casos de teste gerados por humanos.
  2. Consciência de Contexto: Eles podem lembrar o contexto de interações anteriores, permitindo respostas mais precisas em tarefas em andamento.
  3. Tomada de Decisão: Os LLMs podem tomar decisões informadas com base nas informações que coletam durante os testes.

Desafios na Automação do UAT

Embora a automação do UAT ofereça muitos benefícios, também vem com desafios. Alguns desses desafios incluem:

  1. Instruções Complexas: Os casos de teste muitas vezes têm instruções breves que implicam em muitas ações. Isso torna difícil pros agentes entenderem exatamente o que fazer.
  2. Sensibilidade ao Contexto: A mesma instrução pode significar coisas diferentes dependendo do estado atual do app. Os agentes precisam ser capazes de se adaptar a essas mudanças rapidamente.
  3. Seleção de Parâmetros: Com muitos parâmetros pra escolher, os agentes precisam ser precisos na seleção dos certos pra cada teste.
  4. Verificação Passo a Passo: Cada ação deve ser verificada pra garantir que leva ao resultado desejado. Se houver um erro em qualquer etapa, todo o caso de teste pode falhar.

Conclusão

A introdução do XUAT-Copilot marca um passo significativo na automação dos testes de aceitação do usuário pra aplicações como o WeChat Pay. Ao aproveitar as capacidades dos grandes modelos de linguagem, esse sistema pode lidar com aspectos do UAT que antes eram intensivos em mão de obra e demorados.

Esse avanço não só aumenta a velocidade e a eficiência dos testes, mas também garante que a qualidade do software se mantenha alta. À medida que o sistema continua a evoluir, ele tem um grande potencial pra melhorar o desenvolvimento de software e a experiência do usuário no futuro.

Fonte original

Título: XUAT-Copilot: Multi-Agent Collaborative System for Automated User Acceptance Testing with Large Language Model

Resumo: In past years, we have been dedicated to automating user acceptance testing (UAT) process of WeChat Pay, one of the most influential mobile payment applications in China. A system titled XUAT has been developed for this purpose. However, there is still a human-labor-intensive stage, i.e, test scripts generation, in the current system. Therefore, in this paper, we concentrate on methods of boosting the automation level of the current system, particularly the stage of test scripts generation. With recent notable successes, large language models (LLMs) demonstrate significant potential in attaining human-like intelligence and there has been a growing research area that employs LLMs as autonomous agents to obtain human-like decision-making capabilities. Inspired by these works, we propose an LLM-powered multi-agent collaborative system, named XUAT-Copilot, for automated UAT. The proposed system mainly consists of three LLM-based agents responsible for action planning, state checking and parameter selecting, respectively, and two additional modules for state sensing and case rewriting. The agents interact with testing device, make human-like decision and generate action command in a collaborative way. The proposed multi-agent system achieves a close effectiveness to human testers in our experimental studies and gains a significant improvement of Pass@1 accuracy compared with single-agent architecture. More importantly, the proposed system has launched in the formal testing environment of WeChat Pay mobile app, which saves a considerable amount of manpower in the daily development work.

Autores: Zhitao Wang, Wei Wang, Zirao Li, Long Wang, Can Yi, Xinjie Xu, Luyang Cao, Hanjing Su, Shouzhi Chen, Jun Zhou

Última atualização: 2024-01-10 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2401.02705

Fonte PDF: https://arxiv.org/pdf/2401.02705

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes