Simple Science

La science de pointe expliquée simplement

La science de pointe expliquée simplement

Shizhuo Dylan Zhang

Génie logiciel Évaluer le raisonnement de code dans les grands modèles de langage

Un nouveau cadre pour évaluer la compréhension des tâches de code par les LLMs.

2025-09-08T08:35:48+00:00 ― 12 min lire

Intelligence artificielle Évaluer les modèles de langage dans le codage scientifique

Un nouveau benchmark évalue les modèles de langage sur des défis de codage scientifique dans plusieurs domaines.

2025-07-10T17:22:48+00:00 ― 7 min lire