Des chercheurs améliorent les grands modèles de langage grâce à l'auto-amélioration avec des méthodes basées sur le code.
Dian Yu, Baolin Peng, Ye Tian
― 10 min lire
La science de pointe expliquée simplement
Des chercheurs améliorent les grands modèles de langage grâce à l'auto-amélioration avec des méthodes basées sur le code.
Dian Yu, Baolin Peng, Ye Tian
― 10 min lire
Une méthode pour accélérer la génération de texte sans perdre en qualité.
Lujun Gui, Bin Xiao, Lei Su
― 6 min lire
Cette étude évalue le rôle des automates cellulaires neuronaux dans la segmentation d'images médicales.
Steven Korevaar, Ruwan Tennakoon, Alireza Bab-Hadiashar
― 8 min lire
INK offre une méthode fiable pour identifier les échantillons hors distribution en apprentissage automatique.
Jirayu Burapacheep, Yixuan Li
― 10 min lire
ConsistencyTrack améliore le suivi des objets dans les vidéos en utilisant des techniques innovantes de gestion du bruit.
Lifan Jiang, Zhihui Wang, Siqi Yin
― 7 min lire
Kangaroo améliore l'analyse vidéo en intégrant efficacement visuels, sons et textes.
Jiajun Liu, Yibing Wang, Hanghang Ma
― 7 min lire
Présentation de LRP4RAG, une méthode pour mieux détecter les hallucinations dans les modèles de langage.
Haichuan Hu, Yuhan Sun, Quanjun Zhang
― 8 min lire
Ce papier présente un modèle à un seul encodeur pour améliorer la segmentation d'images basé sur des descriptions textuelles.
Seonghoon Yu, Ilchae Jung, Byeongju Han
― 8 min lire
De nouvelles méthodes améliorent la séparation des voix dans des environnements bruyants.
Tathagata Bandyopadhyay
― 5 min lire
Analyse de l'impact des composants basés sur les quaternions sur les performances de classification d'images.
Gerardo Altamirano-Gómez, Carlos Gershenson
― 6 min lire
MAPF-GPT propose une approche innovante pour résoudre les défis de cheminement multi-agents en utilisant l'apprentissage machine.
Anton Andreychuk, Konstantin Yakovlev, Aleksandr Panov
― 10 min lire
Cette étude utilise l'apprentissage automatique pour identifier les jets de quarks étranges et améliorer le tagging de fragmentation.
Yevgeny Kats, Edo Ofir
― 9 min lire
FPDT propose une solution pour entraîner des LLMs à long contexte de manière plus efficace.
Jinghan Yao, Sam Ade Jacobs, Masahiro Tanaka
― 7 min lire
MemLong améliore la capacité des modèles de langage à gérer efficacement des textes longs.
Weijie Liu, Zecheng Tang, Juntao Li
― 8 min lire
Un aperçu de comment l'apprentissage par transfert influence la performance des modèles à travers les lois de mise à l'échelle.
Matthew Barnett
― 8 min lire
Une nouvelle méthode pour expliquer les prédictions dans des données spatialement dépendantes en utilisant Random Forest.
Luca Patelli, Natalia Golini, Rosaria Ignaccolo
― 8 min lire
Des recherches montrent que les robots peuvent améliorer l'apprentissage en utilisant des motifs de mouvement issus de tâches précédentes.
Li-Heng Lin, Yuchen Cui, Amber Xie
― 8 min lire
Explorer les défis de l'apprentissage multi-tâches et continu en apprentissage automatique.
Mohammadamin Banayeeanzade, Mahdi Soltanolkotabi, Mohammad Rostami
― 8 min lire
Une nouvelle méthode pour extraire des événements des récits portugais en utilisant des modèles avancés.
Luís Filipe Cunha, Ricardo Campos, Alípio Jorge
― 8 min lire
Une nouvelle méthode améliore la performance des réseaux de neurones bayésiens grâce à la symétrisation.
Yoav Gelberg, Tycho F. A. van der Ouderaa, Mark van der Wilk
― 6 min lire
Ce travail améliore la résolution de la coréférence à travers les langues avec un nouveau jeu de données et des méthodes.
Ondřej Pražák, Miloslav Konopík
― 8 min lire
Une nouvelle approche améliore la qualité des images dans les VAE multimodaux en utilisant des décodeurs de diffusion.
Daniel Wesego, Amirmohammad Rooshenas
― 10 min lire
Une nouvelle méthode améliore les réseaux de neurones pour résoudre des équations de physique complexes.
Yilong Hou, Xi'an Li, Jinran Wu
― 5 min lire
Une nouvelle approche pour améliorer l'équité et la précision dans la reconnaissance faciale.
Ayesha Manzoor, Ajita Rattani
― 6 min lire
Un aperçu du domaine en évolution des modèles d'apprentissage profond topologiques et de leurs atouts.
Yam Eitan, Yoav Gelberg, Guy Bar-Shalom
― 6 min lire
Une nouvelle méthode pour réduire des graphes complexes tout en gardant les caractéristiques clés pour la classification.
Arash Rasti-Meymandi, Ahmad Sajedi, Zhaopan Xu
― 7 min lire
Une nouvelle méthode améliore la qualité et l'efficacité de la génération de vidéos.
Liuhan Chen, Zongjian Li, Bin Lin
― 7 min lire
Une nouvelle méthode améliore la précision des retouches d'images localisées en utilisant des modèles de diffusion.
Theodoros Kouzelis, Manos Plitsis, Mihalis A. Nicolaou
― 5 min lire
De nouvelles méthodes améliorent la précision de la complétion de tenseurs avec moins d'échantillons.
Alejandro Gomez-Leos, Oscar López
― 6 min lire
Un nouveau cadre améliore la précision des légendes d'images et réduit les erreurs.
Qian Cao, Xu Chen, Ruihua Song
― 7 min lire
Les PINNs allient la physique et les données pour résoudre efficacement des problèmes scientifiques complexes.
Maziar Raissi, Paris Perdikaris, Nazanin Ahmadi
― 7 min lire
PromptSmooth améliore l'exactitude des Med-VLMs contre les attaques adversariales de manière efficace.
Noor Hussein, Fahad Shamshad, Muzammal Naseer
― 5 min lire
Une étude révèle que des modèles moins chers pourraient produire de meilleures données d'entraînement pour les tâches de raisonnement.
Hritik Bansal, Arian Hosseini, Rishabh Agarwal
― 8 min lire
Une nouvelle approche améliore la gestion des données vidéo tout en gardant de bonnes performances dans les applis en temps réel.
Shiwei Wu, Joya Chen, Kevin Qinghong Lin
― 7 min lire
Le Réseau Dowker Neural Dynamique améliore l'analyse des graphes dirigés en évolution.
Hao Li, Hao Jiang, Jiajun Fan
― 8 min lire
Une nouvelle approche améliore la détection d'actions dans les vidéos en s'attaquant à l'effondrement de l'attention.
Jihwan Kim, Miso Lee, Cheol-Ho Cho
― 8 min lire
Une nouvelle méthode améliore l'inférence grammaticale pour les langages de programmation avec une meilleure précision et lisibilité.
Feifei Li, Xiao Chen, Xi Xiao
― 10 min lire
Une nouvelle méthode améliore la création de vidéos réalistes d'interactions entre objets en utilisant des données de profondeur.
Anisha Jain
― 8 min lire
Une nouvelle approche pour améliorer l'entraînement de GFlowNet avec des récompenses dépendantes de la politique.
Puhua Niu, Shili Wu, Mingzhou Fan
― 6 min lire
Des réseaux innovants qui apprennent à partir de structures de données CW-complex dans différents domaines.
Rahul Khorana
― 6 min lire