Évaluer les risques de résultats biaisés chez les robots en utilisant des modèles de langage.
― 8 min lire
La science de pointe expliquée simplement
Évaluer les risques de résultats biaisés chez les robots en utilisant des modèles de langage.
― 8 min lire
Cette étude met en avant le biais dans les modèles linguistiques qui répondent à différents dialectes de l'anglais.
― 7 min lire
Cette étude améliore l'évaluation automatique des essais en se concentrant sur la grammaire.
― 7 min lire
GigaSpeech 2 propose un énorme jeu de données pour les langues peu répandues afin d'améliorer la reconnaissance vocale.
― 6 min lire
Un nouveau modèle améliore la technologie de synthèse vocale avec efficacité et adaptabilité.
― 8 min lire
SciEx révèle les forces et les défis des LLMs dans l'évaluation scientifique.
― 8 min lire
Un nouveau jeu de données pour améliorer la compréhension des récits dans les courts-métrages.
― 10 min lire
Un aperçu de comment la qualité du texte est liée à sa probabilité dans les modèles de langue.
― 9 min lire
Voici CHIRON, un système de représentation de personnages pour des histoires plus captivantes.
― 7 min lire
Une étude révèle un biais de genre dans les suggestions de carrière de chatGPT pour les enfants.
― 9 min lire
SEACrowd vise à améliorer la représentation de l'IA pour les langues et les cultures d'Asie du Sud-Est.
― 9 min lire
Une nouvelle méthode qui optimise l'analyse et la synthèse de la parole en utilisant les mouvements du tractus vocal.
― 9 min lire
Un regard de plus près sur comment les Transformers apprennent à partir d'exemples dans des contextes variés.
― 9 min lire
Examiner l'impact des dialectes sur la précision de la détection des biais linguistiques.
― 8 min lire
Cette étude montre comment BERT apprend des faits sur le COVID-19 grâce à un entraînement continu.
― 5 min lire
Un ensemble de données pour tester les connexions entre images et textes montre que les modèles galèrent avec les tâches de texte à image.
― 7 min lire
Un nouveau point de référence pour évaluer les connaissances culturelles dans les modèles linguistiques à travers des cultures diverses.
― 8 min lire
Un nouveau critère évalue les capacités des modèles d'IA dans des environnements cliniques réels.
― 9 min lire
Une méthode pour améliorer l'identification des fausses nouvelles en utilisant les interactions sur les réseaux sociaux.
― 9 min lire
Explorer la synergie entre l'apprentissage fédéré et l'intelligence en essaim pour améliorer l'IA.
― 9 min lire
Une nouvelle méthode améliore efficacement le traitement des longs textes dans les modèles de langage.
― 10 min lire
De nouvelles méthodes pourraient affiner la compréhension des modèles de langage sur les préférences humaines.
― 7 min lire
Une nouvelle approche pour améliorer les modèles de langue pour les langues à faibles ressources.
― 8 min lire
Explorer comment l'IA améliore la compréhension et la précision des réponses basées sur le dialogue.
― 6 min lire
Une nouvelle méthode améliore les prévisions de santé mentale en analysant les publications sur les réseaux sociaux au fil du temps.
― 8 min lire
Une étude évalue les modèles de langage sur leur capacité à gérer plusieurs tâches en même temps.
― 10 min lire
Une nouvelle technique améliore les modèles de langage en mettant à jour et en ajoutant des connaissances de façon efficace.
― 10 min lire
Examiner l'efficacité du raisonnement dans les grands modèles de langage.
― 10 min lire
Un nouveau benchmark teste les capacités des LLM avec des formats de données structurées.
― 8 min lire
Ce papier étudie l'effet de consensus faux dans les grands modèles de langage.
― 6 min lire
Le Twin-Merging améliore l'efficacité du mélange de modèles et leur adaptabilité à différentes tâches.
― 5 min lire
Un nouveau cadre améliore la façon dont les agents LLM apprennent grâce à des conseils de processus détaillés.
― 10 min lire
Un ensemble de données pour tester la compréhension des différences de formulation par les modèles de langage.
― 7 min lire
Découvrez RePrompt pour améliorer la performance des modèles de langage grâce à des invites optimisées.
― 8 min lire
Examiner les capacités des LLM par rapport aux taxonomies traditionnelles.
― 6 min lire
Cette étude examine les biais dans les modèles d'IA lors de l'étiquetage des données de discours de haine.
― 9 min lire
Explorer le rôle de l'IA dans l'amélioration de la cohérence des notes dans l'éducation en ligne.
― 10 min lire
Examiner le besoin de contexte dans une traduction précise en langue des signes.
― 7 min lire
Ce papier présente un cadre pour évaluer les vulnérabilités des grands modèles de langage.
― 4 min lire
Un nouveau critère évalue comment les modèles de langage gèrent les changements de texte.
― 8 min lire