Une étude met en lumière les lacunes dans les capacités de raisonnement des LLM pour résoudre des problèmes de maths.
― 9 min lire
La science de pointe expliquée simplement
Une étude met en lumière les lacunes dans les capacités de raisonnement des LLM pour résoudre des problèmes de maths.
― 9 min lire
Une nouvelle méthode pour tester la sécurité des modèles de langage et leurs compétences multilingues.
― 10 min lire
Un nouvel outil utilise l'apprentissage automatique pour détecter les bugs de performance de manière efficace.
― 6 min lire
Un nouveau jeu de données améliore l'efficacité de recherche de code pour les développeurs qui utilisent des requêtes en langage naturel.
― 9 min lire
Une nouvelle base de données améliore la compréhension des histoires dans plusieurs langues.
― 8 min lire
Explorer des méthodes quantiques pour un biclustering efficace dans des ensembles de données complexes.
― 7 min lire
Une nouvelle méthode améliore la traduction automatique pour les langues sous-représentées.
― 7 min lire
Un nouveau jeu de données pour améliorer l'interprétation des images de télédétection par les machines.
― 9 min lire
Les LLM peuvent aider à protéger contre l'ingénierie sociale, mais ils peuvent aussi poser de nouveaux risques.
― 8 min lire
Un nouveau modèle génère de la poésie tchèque avec une meilleure rime et un meilleur rythme.
― 9 min lire
WavRx analyse la parole pour la santé tout en protégeant la vie privée, montrant des résultats diagnostiques prometteurs.
― 10 min lire
Un ensemble de données riches de 2,7 millions d'articles de presse de 1878 à 1977.
― 9 min lire
Une nouvelle méthode pour protéger les jeux de données contre une utilisation non autorisée dans les modèles génératifs.
― 11 min lire
Une étude sur comment les modèles de langage génèrent des raisons convaincantes pour évaluer des arguments.
― 7 min lire
Examiner comment les modèles de langage gèrent les mots espagnols ambigus à travers un nouveau dataset.
― 7 min lire
Stylebreeder permet aux utilisateurs de générer et de personnaliser de l'art avec des invites textuelles.
― 7 min lire
Une étude sur comment les modèles d'estimation de pose se comportent avec des images corrompues.
― 10 min lire
Un nouvel outil pour évaluer les biais dans les grands modèles de vision-langage.
― 8 min lire
Une nouvelle méthode améliore les IRM en utilisant des images précédentes pour des résultats plus rapides.
― 6 min lire
Un nouveau modèle prédit la thermostabilité des nanobodies en utilisant des données limitées.
― 8 min lire
Un nouveau jeu de données améliore l'analyse des collisions arrière et l'évaluation des technologies de sécurité.
― 9 min lire
Une nouvelle méthode améliore notre façon d'évaluer les contre-narrations à la haine.
― 8 min lire
Stratégies pour améliorer la fiabilité dans la détection d'images créées par l'IA.
― 11 min lire
InternLM-Law améliore les réponses à diverses questions juridiques chinoises grâce à une formation avancée.
― 9 min lire
Une étude sur PlagBench et son rôle dans la détection du plagiat dans les résultats des LLM.
― 6 min lire
La recherche évalue les capacités de vérification des affirmations des modèles de langage en utilisant un nouveau dataset.
― 7 min lire
Un nouveau jeu de données évalue la performance des LLM dans la résolution de problèmes liés aux graphes.
― 8 min lire
De nouvelles méthodes améliorent les compétences de raisonnement des modèles de langage pour de meilleures performances sur les tâches.
― 9 min lire
Un nouveau modèle combine des données audio et visuelles pour une meilleure compréhension.
― 7 min lire
Une étude sur l'impact des images et du texte dans le cadrage des nouvelles sur la violence armée.
― 9 min lire
Utiliser des interfaces visuelles et des modèles pour améliorer la génération de musique.
― 7 min lire
S'attaquer aux biais dans la reconnaissance faciale grâce à des ensembles de données d'entraînement équilibrés.
― 11 min lire
Cette étude évalue à quel point les LLMs raisonnent sur les directions cardinales.
― 6 min lire
Le dataset CRED booste la recherche sur les relations causales gène-maladie dans la littérature biomédicale.
― 8 min lire
Découvrez l'impact de l'Arboretum sur la recherche en IA pour la biodiversité.
― 8 min lire
Un nouveau cadre améliore la façon dont les utilisateurs interrogent les données IoT et classifient les menaces.
― 9 min lire
Cette étude examine les biais dans les modèles de langue bengali et leurs effets sur la société.
― 8 min lire
Un outil de référence fait progresser les stratégies d'apprentissage actif en apprentissage automatique.
― 9 min lire
RAGBench propose un dataset complet pour évaluer les systèmes de Génération Augmentée par Récupération.
― 8 min lire
APIGen génère des ensembles de données diversifiés et de haute qualité pour les agents d'appel de fonctions.
― 7 min lire