Valutare i LLM nei GiochiValutare i LLM nei Giochicompetenze LLM e il lavoro di squadra.Nuovo benchmark per valutare leCalcolo e linguaggioValutare i Grandi Modelli di Linguaggio in Ambienti Multi-AgenteNuovo benchmark valuta le abilità dei LLM nell'interagire con più agenti.2025-09-04T00:58:30+00:00 ― 13 leggere min