Cet article examine une nouvelle façon de créer des algorithmes avec des LLMs.
― 6 min lire
La science de pointe expliquée simplement
Cet article examine une nouvelle façon de créer des algorithmes avec des LLMs.
― 6 min lire
Apprends comment la logique à sept valeurs améliore la prise de décision avec plusieurs critères.
― 7 min lire
Un défi axé sur des modèles génératifs profonds pour la génération d'images médicales réalistes.
― 12 min lire
Un modèle évalue la lisibilité des articles Wikipedia dans 14 langues.
― 9 min lire
Une nouvelle approche utilisant des LLM pour créer des distracteurs avec un minimum d'intervention humaine.
― 5 min lire
Une nouvelle approche pour évaluer les biais dans les métriques d'évaluation automatisées de l'IA.
― 8 min lire
De nouvelles méthodes visent à améliorer les capacités de raisonnement des modèles de langage.
― 8 min lire
De nouvelles métriques mettent en lumière les limites des modèles de langage dans leur capacité à représenter la réalité.
― 9 min lire
Un nouveau système pour évaluer les modèles linguistiques en utilisant des flux de données du monde réel.
― 7 min lire
Présentation d'IrokoBench pour améliorer l'évaluation des LLM dans les langues africaines.
― 9 min lire
Le défi ULS23 vise à améliorer la segmentation des tumeurs dans les scans CT pour un meilleur soin du cancer.
― 7 min lire
Une nouvelle approche améliore la détection des fausses images créées par l'IA.
― 8 min lire
Un nouveau standard vise à évaluer les MLLMs dans la compréhension vidéo sur plusieurs sujets.
― 8 min lire
Cette étude présente une nouvelle méthode pour identifier les images d'entraînement clés dans les visuels générés par l'IA.
― 10 min lire
Explorer l'importance des méthodes de désapprentissage dans l'apprentissage automatique moderne.
― 6 min lire
Examiner les problèmes clés en MARL hors ligne et proposer des solutions standardisées.
― 7 min lire
Apprends à connaître le CGP, sa fonction, ses avantages, ses applications et ses défis en programmation.
― 6 min lire
Un nouveau jeu de données améliore la cohérence dans les séquences image-texte pour une création de contenu efficace.
― 7 min lire
SciEx révèle les forces et les défis des LLMs dans l'évaluation scientifique.
― 8 min lire
SEACrowd vise à améliorer la représentation de l'IA pour les langues et les cultures d'Asie du Sud-Est.
― 9 min lire
Une étude évalue les modèles de langage sur leur capacité à gérer plusieurs tâches en même temps.
― 10 min lire
Un nouveau benchmark teste les capacités des LLM avec des formats de données structurées.
― 8 min lire
VCEval propose un moyen automatisé d'évaluer l'efficacité des cours en ligne.
― 6 min lire
Un nouveau benchmark vise la compositionnalité dans la compréhension vidéo et les modèles de langage.
― 7 min lire
Une nouvelle méthode améliore les tests pour les modèles de langage en utilisant des données réelles des utilisateurs.
― 7 min lire
La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.
― 10 min lire
Évaluer comment les modèles de langue gèrent les indices culturels dans des tâches réelles.
― 10 min lire
VideoVista propose une évaluation complète pour les modèles de question-réponse vidéo.
― 8 min lire
Cet article explore des méthodes pour améliorer la fiabilité des artefacts de recherche en informatique.
― 10 min lire
Les modèles GLM-4 montrent de meilleures capacités dans la compréhension et la génération de langage.
― 10 min lire
Une étude sur l'utilisation des LLMs pour juger d'autres LLMs et ses implications.
― 9 min lire
Une étude sur comment les modèles de langage génèrent des raisons convaincantes pour évaluer des arguments.
― 7 min lire
Deux nouveaux modèles visent à améliorer l'accès à la technologie pour les locuteurs galiciens.
― 7 min lire
Examiner les difficultés de traduire un langage métaphorique en traduction automatique.
― 8 min lire
DF40 propose une approche complète pour améliorer les méthodes de détection des deepfakes.
― 8 min lire
Cette étude évalue l'honnêteté des LLM dans trois domaines clés.
― 7 min lire
Découvrez comment les entreprises améliorent leurs systèmes de questions-réponses pour un meilleur support utilisateur.
― 5 min lire
Une étude sur comment l'IA comprend les algorithmes et leurs implications.
― 8 min lire
Une nouvelle métrique améliore l'évaluation des modèles de classification de texte dans différents domaines.
― 9 min lire
La contamination des données affecte grave l'évaluation des grands modèles de langue.
― 7 min lire