L'étude examine l'efficacité des LLM spécialisés dans les tâches cliniques.
― 7 min lire
La science de pointe expliquée simplement
L'étude examine l'efficacité des LLM spécialisés dans les tâches cliniques.
― 7 min lire
Un aperçu des découvertes récentes sur les méthodes d'évaluation de la traduction automatique.
― 6 min lire
FSDEM propose une nouvelle approche pour évaluer les techniques de sélection de caractéristiques pour l'analyse des données.
― 7 min lire
Cet article parle de l'évaluation des LLMs dans les pratiques de codage sécurisé.
― 8 min lire
Une nouvelle méthode pour évaluer à quel point les LLM comprennent et appliquent les règles.
― 8 min lire
Une nouvelle méthode pour évaluer et comparer les connaissances des modèles de langage.
― 8 min lire
Une nouvelle méthode améliore la création de panoramas en utilisant l'opérateur Merge-Attend-Diffuse.
― 7 min lire
Un cadre d'évaluation complet pour les chatbots de santé est introduit pour améliorer leur efficacité.
― 8 min lire
Un nouvel outil aide à évaluer les compétences en codage JavaScript et les niveaux de maîtrise.
― 6 min lire
Ce système aide à penser et à prendre des décisions grâce à un raisonnement structuré.
― 7 min lire
Cette étude examine comment les recruteurs perçoivent les outils d'IA dans le recrutement en ingénierie logicielle.
― 7 min lire
Cet article parle d'un nouveau système de notation pour évaluer les modèles de langue de manière plus juste.
― 7 min lire
LongGenBench évalue les grands modèles de langage dans la génération de textes longs de haute qualité.
― 8 min lire
Les grands modèles de langage améliorent l'efficacité des évaluations de réponses médicales.
― 8 min lire
Cette étude évalue des modèles de machine learning pour détecter les déchets dans les rivières.
― 6 min lire
Examiner les problèmes éthiques liés à l'utilisation des modèles de langage pour les troubles psychiatriques.
― 11 min lire
VisScience teste de gros modèles sur le raisonnement scientifique en utilisant du texte et des images.
― 6 min lire
Cette étude évalue comment les LLM gèrent les requêtes SPARQL et les Graphes de Connaissances.
― 6 min lire
Une analyse de la performance des systèmes de récupération dans des environnements de données en évolution.
― 6 min lire
Une nouvelle méthode améliore la manière dont les modèles de langage suivent des instructions complexes.
― 6 min lire
Présentation d'un cadre innovant pour tester les interactions des modèles de langage dans des scénarios de jeu de rôle.
― 11 min lire
TeXBLEU offre un moyen fiable d'évaluer des expressions LaTeX à partir de maths parlées.
― 7 min lire
Un cadre pour améliorer la performance de l'IA dans les tâches visuelles en imitant les jugements humains.
― 7 min lire
Une nouvelle méthode pour évaluer la qualité de la génération d'images IRM cérébrales.
― 8 min lire
Explore l'essor et l'impact des modèles fondamentaux en intelligence artificielle.
― 7 min lire
Un nouveau modèle améliore la précision des prédictions pour les protéines liant l'ADN chez les plantes.
― 9 min lire
Utiliser des LLM pour générer des caractéristiques claires à partir de textes scientifiques pour de meilleures prédictions.
― 8 min lire
Un nouveau système d'index vise à améliorer la gestion des troubles de la déglutition chez les personnes âgées.
― 7 min lire
Utiliser des modèles de langage moins puissants peut améliorer l'alignement de l'IA de manière efficace.
― 7 min lire
Améliorer les évaluations des robots peut donner des infos plus poussées sur leurs capacités.
― 10 min lire
Un nouveau jeu de données vise à améliorer les systèmes de QA pour le Quran et les Ahadith.
― 11 min lire
Cette étude examine le biais de genre dans les évaluations des profs générées par des modèles d'IA.
― 13 min lire
Des robots conscients d'eux-mêmes peuvent adapter leurs mouvements pour des interactions plus sûres.
― 8 min lire
Une nouvelle méthode améliore la génération de données de texture pour les modèles d'apprentissage automatique.
― 8 min lire
Beaucoup de survivants du cancer pédiatrique subissent des pertes d'audition à cause des traitements.
― 6 min lire
THaMES propose un cadre pour réduire les hallucinations dans les modèles de langage.
― 7 min lire
Une méthode pour évaluer les évaluations des agents IA en matière de sécurité et de fiabilité.
― 10 min lire
Un nouveau benchmark améliore l'évaluation des systèmes de détection de paraphrase.
― 6 min lire
L'IA peut aider à créer des supports d'étude efficaces pour les examens médicaux.
― 8 min lire
Apprends à créer des graphes de connaissance efficaces pour des applis industrielles.
― 7 min lire