Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio

Analizzare gli agenti linguistici nei giochi strategici

Uno studio sul comportamento degli agenti linguistici in un gioco di deduzione sociale.

― 4 leggere min


Agenti Linguistici neiAgenti Linguistici neiGiochi Socialistrategica.attraverso l'interazione socialeEsaminare i modelli linguistici
Indice

I giochi di deduzione sociale strategica aiutano i ricercatori a capire come funzionano i modelli di linguaggio, specialmente per quanto riguarda la loro comprensione delle interazioni sociali. Questo documento parla di un gioco ispirato a "Among Us", dove i giocatori fanno parte dell'equipaggio su un'astronave e cercano di scoprire chi sono gli impostori tra di loro. L'obiettivo è analizzare come si comportano gli agenti linguistici in questo contesto.

Descrizione dell'Ambiente di Gioco

Nel nostro gioco testuale, i giocatori ricevono ruoli come Compagni o Impostori. I Compagni devono completare compiti mentre cercano di identificare gli Impostori che vogliono sabotare i loro sforzi. Questo gioco offre una piattaforma per studiare il Comportamento degli agenti linguistici simulati durante le loro interazioni, permettendoci di valutare le loro abilità decisionali.

Meccaniche di Gioco

Il gioco inizia con i giocatori che assumono ruoli specifici. I Compagni completano i compiti cercando di scoprire l'identità degli Impostori. Nel frattempo, gli Impostori lavorano in modo subdolo per eliminare i Compagni senza farsi beccare. Il gioco alterna tra due fasi: la Fase di Compito, dove i giocatori lavorano ai loro compiti, e la Fase di Riunione, dove discutono e votano su chi sospettano possa essere un impostore.

Ruoli e Responsabilità

Ogni giocatore ha un ruolo definito. I Compagni hanno compiti specifici da completare e devono collaborare per identificare gli Impostori. Gli Impostori devono integrarsi mentre eliminano i Compagni. Le dinamiche tra i giocatori in questi ruoli creano opportunità per pensare strategicamente e prendere decisioni.

Mappa di Gioco

La mappa di gioco è progettata per somigliare all'ambiente di un'astronave in "Among Us", composta da varie stanze dove i giocatori possono completare compiti e interagire. Ogni stanza ha compiti per i Compagni e i giocatori possono osservare le azioni che avvengono nelle stanze vicine attraverso messaggi generati dal sistema.

Fasi di Gioco

Il gioco alterna tra due fasi chiave:

  1. Fase di Compito: I Compagni completano i compiti mentre cercano indizi sugli impostori. Gli Impostori possono fingere di lavorare sui compiti o eliminare i Compagni.

  2. Fase di Riunione: Quando viene scoperto un corpo o viene convocata una riunione d'emergenza, i giocatori discutono le loro osservazioni e votano sugli Impostori sospettati. Questa fase è cruciale per la deduzione sociale e l'implementazione delle strategie.

Comportamento degli Agenti

Esploriamo come si comportano gli agenti linguistici simulati all'interno del gioco. La loro capacità di ricordare interazioni passate e adattare le loro strategie è fondamentale per le loro prestazioni. La memoria degli agenti gioca un ruolo significativo nel prendere decisioni, permettendo loro di analizzare le situazioni in corso e fare scelte informate.

Personalità e Variazione

Per incoraggiare comportamenti diversi tra gli agenti, introduciamo un componente di personalità. Ogni agente riceve un tipo di personalità specifico che influisce sulle sue azioni e decisioni durante il gioco. Per esempio, un agente cauto potrebbe comportarsi in modo diverso da uno più aggressivo.

Valutazione delle Prestazioni

Valutiamo le prestazioni degli agenti attraverso vari metodi, esaminando quanto bene comprendono il gioco e seguono le regole stabilite. Questa valutazione include il confronto tra diverse configurazioni di agenti e l'analisi di come la personalità influisce sul loro gameplay.

Valutazioni Controllate

Nelle valutazioni controllate, testiamo l'auto-consapevolezza, la memoria e le capacità di ragionamento degli agenti. Chiedendo agli agenti riguardo ai loro ruoli, azioni e strategie, valutiamo la loro comprensione delle dinamiche di gioco. Ad esempio, vogliamo vedere se un Impostore riesce a spiegare perché è riuscito a evitare di essere scoperto o come un Compagno giustifica le sue sospettosità.

Valutazioni End-to-End

Questa fase di valutazione guarda ai tassi di successo complessivi di diversi agenti. Testare varie combinazioni di ruoli e strategie fornisce intuizioni su come gli agenti si comportano in condizioni diverse. Valutiamo variabili come quanto bene completano i compiti e identificano gli impostori.

Osservazioni e Intuizioni

Dai nostri esperimenti, osserviamo che i Compagni generalmente superano gli Impostori in alcune aree, come auto-consapevolezza e riflessione. Questo suggerisce che essere un Compagno potrebbe richiedere una migliore comprensione dei ruoli e delle responsabilità nel gioco. Gli Impostori, d'altra parte, potrebbero aver bisogno di abilità di pianificazione più forti per riuscire nell'inganno.

Analisi del Linguaggio

Esaminare le conversazioni tra i giocatori offre intuizioni sul loro pensiero strategico. Categorizziamo il discorso in varie categorie come inganno, verità e sospetto. Questa analisi rivela come i giocatori comunicano le loro intenzioni e strategie, migliorando la nostra comprensione dei loro processi decisionali.

Conclusione

Lo studio mostra come i modelli di linguaggio possano essere testati in un ambiente complesso di gioco di deduzione sociale. Le intuizioni ottenute possono guidare la ricerca futura per migliorare i sistemi di IA in scenari strategici interattivi. Il nostro lavoro fornisce una base per esplorare le capacità dei modelli di linguaggio e le loro potenziali applicazioni nei giochi e oltre.

Fonte originale

Titolo: AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game

Estratto: Strategic social deduction games serve as valuable testbeds for evaluating the understanding and inference skills of language models, offering crucial insights into social science, artificial intelligence, and strategic gaming. This paper focuses on creating proxies of human behavior in simulated environments, with Among Us utilized as a tool for studying simulated human behavior. The study introduces a text-based game environment, named AmongAgents, that mirrors the dynamics of Among Us. Players act as crew members aboard a spaceship, tasked with identifying impostors who are sabotaging the ship and eliminating the crew. Within this environment, the behavior of simulated language agents is analyzed. The experiments involve diverse game sequences featuring different configurations of Crewmates and Impostor personality archetypes. Our work demonstrates that state-of-the-art large language models (LLMs) can effectively grasp the game rules and make decisions based on the current context. This work aims to promote further exploration of LLMs in goal-oriented games with incomplete information and complex action spaces, as these settings offer valuable opportunities to assess language model performance in socially driven scenarios.

Autori: Yizhou Chi, Lingjun Mao, Zineng Tang

Ultimo aggiornamento: 2024-07-24 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2407.16521

Fonte PDF: https://arxiv.org/pdf/2407.16521

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili