Pontus Stenetorp

Cette étude évalue la capacité de LLaMa à traduire en tenant compte du genre.

2025-09-30T03:50:24+00:00 ― 8 min lire

Présentation d'IrokoBench pour améliorer l'évaluation des LLM dans les langues africaines.

2025-08-02T00:44:12+00:00 ― 9 min lire

Cet article examine des méthodes pour évaluer la variance dans les benchmarks d'évaluation des modèles de langue.

2025-07-28T23:26:06+00:00 ― 10 min lire

Cette recherche se concentre sur l'amélioration des méthodes pour enlever les infos indésirables des modèles de langage.

2025-07-24T23:42:48+00:00 ― 6 min lire

Cet article parle des défis pour détecter les hallucinations dans la traduction automatique entre différentes langues.

2025-07-08T06:15:42+00:00 ― 7 min lire

Les tests Linguini évaluent à quel point les modèles raisonnent avec des langues diverses.

2025-06-10T02:01:18+00:00 ― 8 min lire

Les tâches NLI sont-elles toujours pertinentes pour tester les grands modèles de langage ?

2025-05-14T07:05:20+00:00 ― 8 min lire