Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Künstliche Intelligenz

Die Optimierung von User Acceptance Testing mit XUAT-Copilot

Die Automatisierung von UAT für WeChat Pay erhöht die Effizienz und verringert Fehler.

― 5 min Lesedauer


Automatisierung vonAutomatisierung vonWeChat Pay TestsEffizienz.XUAT-Copilot verwandelt UAT für mehr
Inhaltsverzeichnis

Benutzerakzeptanztests (UAT) sind ein wichtiger Schritt in der Softwareentwicklung. In dieser Phase testen echte Benutzer die Software, um zu sehen, ob sie ihren Bedürfnissen entspricht. Das Hauptziel von UAT ist es, zu bestätigen, dass die Software in einer realen Umgebung wie erwartet funktioniert. Allerdings erfordert traditionelles UAT oft viel manuelle Arbeit. Das kann eine Menge Zeit in Anspruch nehmen und hat eine höhere Wahrscheinlichkeit für menschliche Fehler.

Bedeutung von WeChat Pay

WeChat Pay ist eine der grössten Mobilzahlungs-Apps in China. Sie spielt eine riesige Rolle im Alltag von Milliarden von Nutzern. Damit die Nutzer zufrieden sind, muss es immer perfekt funktionieren. Deshalb ist UAT für WeChat Pay so wichtig. Das Ziel ist es, ein System zu schaffen, das UAT einfacher und weniger arbeitsintensiv macht.

Die Herausforderung von UAT

Früher bestand der UAT-Prozess für WeChat Pay darin, Testfälle aus den Geschäftsanforderungen zu erstellen. Diese wurden dann an menschliche Tester weitergegeben, die Skripte schreiben mussten, um diese Tests auszuführen. In diesem Schritt mussten die Tester verschiedene Aktionen in der App ausprobieren, um sicherzustellen, dass die Skripte wie vorgesehen funktionierten. Das machte diesen Teil des Prozesses langwierig und ziemlich ermüdend für die Tester.

Bedarf an Automatisierung

Um Zeit und Mühe zu sparen, liegt der Fokus auf der Automatisierung des UAT-Prozesses. UAT zu automatisieren bedeutet, Technologie zu nutzen, um Aufgaben zu übernehmen, die normalerweise menschliche Arbeit erfordern. Damit können wir die Effizienz erhöhen und menschliche Fehler reduzieren.

Einführung von XUAT-Copilot

Um UAT zu verbessern, haben wir ein System namens XUAT-Copilot entwickelt. Dieses System nutzt Grosse Sprachmodelle (LLMs), die fortschrittliche Computerprogramme sind, die entwickelt wurden, um menschliche Sprache zu verstehen und zu generieren. Das Ziel von XUAT-Copilot ist es, Testskripte automatisch zu erstellen, um den UAT-Prozess schneller und einfacher zu machen.

Struktur von XUAT-Copilot

XUAT-Copilot besteht aus mehreren Agenten, von denen jeder für eine andere Aufgabe verantwortlich ist. Diese Agenten arbeiten zusammen, um einen effizienteren UAT-Prozess zu schaffen. Die Hauptkomponenten von XUAT-Copilot umfassen:

  1. Handlungsplanungs-Agent: Dieser Agent erstellt einen Plan für die notwendigen Aktionen basierend auf dem Testfall.
  2. Statusprüfungs-Agent: Dieser Agent überprüft den aktuellen Status der App, um zu sehen, ob die erwarteten Aktionen erfolgreich waren.
  3. Parameterauswahl-Agent: Dieser Agent wählt die richtigen Parameter aus, die für die Durchführung der Aktionen benötigt werden.
  4. Statussensormodul: Dieses Modul sammelt Informationen aus der Benutzeroberfläche der App, um den Agenten bei der Entscheidungsfindung zu helfen.
  5. Fallumschreibungsmodul: Dieses Modul macht die ursprünglichen Testfälle klarer, damit die Agenten sie besser verstehen können.

Wie es funktioniert

Der Prozess beginnt mit Geschäftsanforderungen, die in Testfall-Flussdiagramme umgewandelt werden. Das XUAT-System nimmt diese Flussdiagramme und generiert spezifische Testfälle. Diese Fälle werden dann umgeschrieben, um sie für die Agenten verständlicher zu machen. Die umgeschriebenen Anweisungen werden an den Handlungsplanungs-Agenten gesendet, der Aktionsbefehle generiert.

Interaktion mit der App

Das XUAT-Copilot-System sendet Befehle, um mit der App zu interagieren. Es simuliert Benutzeraktionen basierend auf den generierten Befehlen. Der Statusprüfungs-Agent stellt dann sicher, dass diese Aktionen die erwarteten Ergebnisse geliefert haben. Falls Probleme auftreten, passen die Agenten ihre Aktionen entsprechend an.

Vorteile von XUAT-Copilot

Tests, die von XUAT-Copilot durchgeführt werden, haben sich als fast so effektiv erwiesen wie die von menschlichen Testern. Das System reduziert die für UAT erforderliche Zeit und Mühe erheblich, sodass sich die Teams auf andere wichtige Aufgaben konzentrieren können. Hier sind einige wichtige Vorteile der Verwendung von XUAT-Copilot:

  1. Erhöhte Effizienz: Automatisierung ermöglicht es, Tests in einem Bruchteil der Zeit abzuschliessen, die es mit menschlichen Testern dauern würde.
  2. Reduzierte Fehler: Automatisierte Systeme machen weniger Fehler im Vergleich zu menschlichen Testern.
  3. Kontinuierliche Verbesserung: Das System kann aus vergangenen Tests lernen und sich im Laufe der Zeit verbessern, was es effektiver macht.
  4. Kosteneinsparungen: Durch Zeitersparnis und Verringerung manueller Anstrengungen sinken die Gesamtkosten für UAT.

Die Rolle grosser Sprachmodelle

Grosse Sprachmodelle sind ein zentraler Bestandteil des XUAT-Copilot-Systems. Sie werden mit grossen Mengen an Textdaten trainiert, um menschliche Sprache zu verstehen und zu generieren. Das ermöglicht es den Agenten, effektiv zu kommunizieren und auf komplexe Anweisungen zu reagieren.

Wie LLMs UAT verbessern

LLMs helfen auf verschiedene Arten:

  1. Verarbeitung natürlicher Sprache: Sie können komplexe Sprachbefehle verstehen, was die Arbeit mit menschlich generierten Testfällen erleichtert.
  2. Kontextbewusstsein: Sie können den Kontext vorheriger Interaktionen merken, was genauere Antworten bei laufenden Aufgaben ermöglicht.
  3. Entscheidungsfindung: Die LLMs können fundierte Entscheidungen auf Grundlage der Informationen treffen, die sie während der Tests sammeln.

Herausforderungen bei der Automatisierung von UAT

Obwohl die Automatisierung von UAT viele Vorteile bietet, bringt sie auch Herausforderungen mit sich. Einige dieser Herausforderungen sind:

  1. Komplexe Anweisungen: Testfälle haben oft kurze Anweisungen, die viele Aktionen implizieren. Das macht es den Agenten schwer, genau zu verstehen, was zu tun ist.
  2. Kontextsensitivität: Die gleiche Anweisung kann je nach aktuellem Zustand der App unterschiedliche Bedeutungen haben. Die Agenten müssen in der Lage sein, sich schnell an diese Veränderungen anzupassen.
  3. Parameterauswahl: Bei vielen verfügbaren Parametern müssen die Agenten präzise sein, um die richtigen für jeden Test auszuwählen.
  4. Schritt-für-Schritt-Verifizierung: Jede Aktion muss überprüft werden, um sicherzustellen, dass sie zum gewünschten Ergebnis führt. Wenn es an irgendeinem Schritt einen Fehler gibt, kann der gesamte Testfall fehlschlagen.

Fazit

Die Einführung von XUAT-Copilot stellt einen bedeutenden Fortschritt bei der Automatisierung von Benutzerakzeptanztests für Anwendungen wie WeChat Pay dar. Durch die Nutzung der Fähigkeiten grosser Sprachmodelle kann dieses System Aspekte von UAT bewältigen, die zuvor arbeitsintensiv und zeitaufwändig waren.

Dieser Fortschritt erhöht nicht nur die Geschwindigkeit und Effizienz der Tests, sondern sorgt auch dafür, dass die Qualität der Software hoch bleibt. Während das System weiterentwickelt wird, bietet es grosses Potenzial zur Verbesserung der Softwareentwicklung und des Benutzererlebnisses in der Zukunft.

Originalquelle

Titel: XUAT-Copilot: Multi-Agent Collaborative System for Automated User Acceptance Testing with Large Language Model

Zusammenfassung: In past years, we have been dedicated to automating user acceptance testing (UAT) process of WeChat Pay, one of the most influential mobile payment applications in China. A system titled XUAT has been developed for this purpose. However, there is still a human-labor-intensive stage, i.e, test scripts generation, in the current system. Therefore, in this paper, we concentrate on methods of boosting the automation level of the current system, particularly the stage of test scripts generation. With recent notable successes, large language models (LLMs) demonstrate significant potential in attaining human-like intelligence and there has been a growing research area that employs LLMs as autonomous agents to obtain human-like decision-making capabilities. Inspired by these works, we propose an LLM-powered multi-agent collaborative system, named XUAT-Copilot, for automated UAT. The proposed system mainly consists of three LLM-based agents responsible for action planning, state checking and parameter selecting, respectively, and two additional modules for state sensing and case rewriting. The agents interact with testing device, make human-like decision and generate action command in a collaborative way. The proposed multi-agent system achieves a close effectiveness to human testers in our experimental studies and gains a significant improvement of Pass@1 accuracy compared with single-agent architecture. More importantly, the proposed system has launched in the formal testing environment of WeChat Pay mobile app, which saves a considerable amount of manpower in the daily development work.

Autoren: Zhitao Wang, Wei Wang, Zirao Li, Long Wang, Can Yi, Xinjie Xu, Luyang Cao, Hanjing Su, Shouzhi Chen, Jun Zhou

Letzte Aktualisierung: 2024-01-10 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2401.02705

Quell-PDF: https://arxiv.org/pdf/2401.02705

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel