La recherche met en avant les vulnérabilités des systèmes MNMT face aux attaques par backdoor.
― 9 min lire
La science de pointe expliquée simplement
La recherche met en avant les vulnérabilités des systèmes MNMT face aux attaques par backdoor.
― 9 min lire
Une étude sur comment T5 traite les données structurées pour les requêtes SQL.
― 15 min lire
LP++ améliore l'adaptation des modèles vision-langue, surtout dans les scénarios d'apprentissage avec peu d'exemples.
― 7 min lire
Explore comment Mixture-of-Depths améliore l'efficacité des modèles de langage de manière durable.
― 9 min lire
Une étude montre que les petits modèles fonctionnent bien avec des données d'entraînement simplifiées.
― 9 min lire
Une nouvelle méthode d'entraînement améliore la capacité de composition des modèles vision-langage.
― 7 min lire
Une nouvelle approche pour améliorer la modélisation de sujets en utilisant des relations basées sur des graphes.
― 10 min lire
Un nouveau jeu de données évalue les systèmes RAG pour des réponses précises aux questions.
― 8 min lire
De nouveaux modèles améliorent les compétences de raisonnement dans différentes tâches, ce qui booste les performances de l'IA.
― 9 min lire
Une nouvelle méthode améliore la résolution de la coreférence des événements pour mieux comprendre le texte.
― 8 min lire
Une façon structurée d'évaluer les modèles de langue dans des contextes multilingues.
― 7 min lire
Examiner la distinction usage-mention dans le discours en ligne.
― 8 min lire
Intégrer le raisonnement humain dans la formation de l'IA améliore les explications du modèle et renforce la confiance.
― 8 min lire
Combiner le langage et la navigation améliore le fonctionnement des robots dans différents environnements.
― 8 min lire
Un aperçu des différentes méthodes d'apprentissage utilisées par les modèles linguistiques.
― 8 min lire
Un nouveau cadre améliore les modèles de langue en reconnaissant et en répondant à différents styles de discours.
― 10 min lire
Un nouveau jeu de données améliore la capacité des LLM à suivre des instructions complexes.
― 6 min lire
AQuA évalue la qualité des commentaires en utilisant des avis d'experts et d'utilisateurs.
― 7 min lire
DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.
― 10 min lire
Cet article examine comment les attaques adversariales compromettent les modèles de classification de texte.
― 7 min lire
Examiner comment l'incertitude impacte la prise de décision dans les grands modèles de langage.
― 9 min lire
MGFiD améliore la précision et l'efficacité dans la réponse aux questions ouvertes.
― 6 min lire
De nouvelles méthodes améliorent le traitement des langues dans plusieurs langues différentes.
― 10 min lire
Méthodes innovantes pour entraîner des modèles avec du texte compressé.
― 7 min lire
De nouveaux modèles linguistiques conçus pour des langues diverses en Asie du Sud-Est montrent des résultats prometteurs.
― 7 min lire
Ce travail se concentre sur l'identification des scènes importantes pour améliorer les résumés de scénarios de films.
― 8 min lire
Cette étude examine des méthodes pour préserver la vie privée dans les tâches de traitement du langage.
― 8 min lire
Une nouvelle méthode améliore le lien entre les événements dans les textes grâce à un raisonnement généré par l'IA.
― 10 min lire
Le dataset KazQAD améliore les capacités de réponse aux questions en langue kazakhe.
― 7 min lire
Une nouvelle méthode améliore la segmentation d'images en utilisant des descriptions textuelles et des paires d'images.
― 6 min lire
BEAR améliore l'évaluation des connaissances relationnelles dans les modèles de langue.
― 10 min lire
Améliorer la précision du modèle en corrigeant les problèmes de données d'entrée.
― 8 min lire
Un ensemble de données qui examine comment les gens jugent la plausibilité des événements en fonction du langage.
― 7 min lire
Améliorer les programmes informatiques pour résoudre des problèmes mathématiques en utilisant de meilleurs exemples de données.
― 8 min lire
Cet article explore l'intégration du contrôle PID dans les transformateurs pour améliorer la robustesse et la qualité de sortie.
― 8 min lire
Cet article passe en revue des méthodes pour générer des questions afin d'améliorer l'extraction des arguments d'événements.
― 8 min lire
De nouveaux modèles visent à améliorer la précision dans l'analyse des données des essais cliniques.
― 7 min lire
Ce papier parle de comment personnaliser les LLMs en utilisant des méthodes de récupération pour de meilleures interactions avec les utilisateurs.
― 7 min lire
LLM2Vec améliore les modèles uniquement décodeurs pour un meilleur traitement du langage.
― 8 min lire
Un aperçu de l'extraction des mentions de logiciels dans les textes académiques.
― 7 min lire