Xiangru Tang

Un nouveau cadre simplifie la création d'agents linguistiques autonomes pour diverses applications.

2025-09-26T19:55:06+00:00 ― 7 min lire

Cette étude examine les capacités des LLM à produire des données structurées avec précision.

2025-09-26T00:57:30+00:00 ― 8 min lire

Examiner les vulnérabilités et les stratégies de sécurité pour les agents scientifiques alimentés par des LLM.

2025-09-10T13:23:42+00:00 ― 9 min lire

Un outil conçu pour améliorer les tâches de data science grâce à la planification dynamique et à la vérification des erreurs.

2025-09-03T08:38:54+00:00 ― 6 min lire

L'IA change la façon dont les nouveaux médicaments sont développés, rendant le processus plus rapide et plus efficace.

2025-09-01T18:06:48+00:00 ― 10 min lire

Cet article parle des problèmes et des meilleures pratiques pour évaluer les modèles linguistiques.

2025-08-08T10:07:42+00:00 ― 9 min lire

La contamination des données affecte grave l'évaluation des grands modèles de langue.

2025-07-26T10:12:36+00:00 ― 7 min lire

Cet article parle de nouvelles approches pour améliorer les prévisions dans les réactions chimiques en utilisant la technologie.

2025-07-20T00:37:15+00:00 ― 10 min lire

Un nouveau critère évalue les modèles pour vérifier les revendications financières dans des documents complexes.

2025-05-27T17:33:54+00:00 ― 8 min lire

ChemSafetyBench teste des chatbots sur la sécurité chimique et les connaissances.

2025-05-06T00:39:52+00:00 ― 7 min lire