Découvre comment PEFT optimise l'entraînement des grands modèles de langage efficacement.
Pengfei He
― 8 min lire
La science de pointe expliquée simplement
Découvre comment PEFT optimise l'entraînement des grands modèles de langage efficacement.
Pengfei He
― 8 min lire
Une étude sur la façon dont les modèles linguistiques relient les faits sans raccourcis.
Sohee Yang, Nora Kassner, Elena Gribovskaya
― 8 min lire
Une nouvelle méthode pour les modèles de langue d'améliorer leurs réponses grâce à des critiques auto-génées.
Yue Yu, Zhengxing Chen, Aston Zhang
― 7 min lire
Explorer les dangers d'une mauvaise utilisation de l'intelligence artificielle à travers des invites de jailbreak.
Jean Marie Tshimula, Xavier Ndona, D'Jeff K. Nkashama
― 8 min lire
Cette étude évalue l'efficacité des métriques automatiques pour mesurer la précision des résumés.
Sanjana Ramprasad, Byron C. Wallace
― 6 min lire
La recherche montre que les documents structurés améliorent la performance et la compréhension des modèles de langue.
Kaustubh Ponkshe, Venkatapathy Subramanian, Natwar Modani
― 6 min lire
Un aperçu des méthodes et des défis pour segmenter du texte par sujets.
Iacopo Ghinassi, Lin Wang, Chris Newell
― 8 min lire
Explorer comment l'IA peut évaluer la qualité du langage et les défis qui en découlent.
Dawei Li, Bohan Jiang, Liangjie Huang
― 6 min lire
Un aperçu des vulnérabilités logicielles et des modèles utilisés pour les détecter.
Shahriyar Zaman Ridoy, Md. Shazzad Hossain Shaon, Alfredo Cuzzocrea
― 8 min lire
Examiner les biais dans les modèles de langue IA et les solutions possibles.
Carolin M. Schuster, Maria-Alexandra Dinisor, Shashwat Ghatiwala
― 9 min lire
LaB-RAG aide les docs à rédiger des rapports de radiologie plus clairs et rapidement.
Steven Song, Anirudh Subramanyam, Irene Madejski
― 9 min lire
Explorer comment les élèves qui apprennent ensemble peuvent améliorer l'entraînement des modèles de langue.
Srikrishna Iyer
― 8 min lire
Une nouvelle méthode améliore la capacité des LLM à résoudre efficacement des problèmes de mots en maths.
Xiaocong Yang, Jiacheng Lin, Ziqi Wang
― 8 min lire
Découvrez comment les modèles de langage améliorés par la connaissance boostent la précision et la fiabilité.
Alexander Fichtl, Juraj Vladika, Georg Groh
― 10 min lire
Des chercheurs cherchent de nouvelles façons d'améliorer la performance de l'IA en utilisant des méthodes de feedback innovantes.
Fangkai Jiao, Geyang Guo, Xingxing Zhang
― 8 min lire
Explore comment les modèles de langage apprennent et appliquent les règles de base des maths.
Fu-Chieh Chang, Pei-Yuan Wu
― 5 min lire
De nouveaux tests visent à améliorer l'équité dans les évaluations des voix TTS.
Praveen Srinivasa Varadhan, Amogh Gulati, Ashwin Sankar
― 7 min lire
Le mélange multi-tête d'experts améliore les performances de l'apprentissage machine grâce à des modèles spécialisés.
Shaohan Huang, Xun Wu, Shuming Ma
― 6 min lire
Les LLM peuvent aider les analystes à organiser des données, mais ils ont besoin d'un regard humain.
Raquib Bin Yousuf, Nicholas Defelice, Mandar Sharma
― 6 min lire
Une nouvelle méthode aide les ordinateurs à identifier des objets avec moins d'images et un langage simple.
Cheng-Fu Yang, Da Yin, Wenbo Hu
― 8 min lire
La recherche se concentre sur l'apprentissage des ordinateurs pour comprendre les conversations sur la musique.
Daeyong Kwon, SeungHeon Doh, Juhan Nam
― 6 min lire
Un nouveau modèle permet d'interagir en temps réel avec des vidéos, améliorant la compréhension et l'engagement.
Yueqian Wang, Xiaojun Meng, Yuxuan Wang
― 6 min lire
Un nouveau système transforme les discussions de santé en ligne en données de recherche exploitables.
Ramez Kouzy, Roxanna Attar-Olyaee, Michael K. Rooney
― 6 min lire
Un aperçu de comment l'IA générative aide à améliorer l'écriture et ses méthodes d'évaluation.
Saman Sarraf
― 9 min lire
Examiner le biais dans la modération de contenu et améliorer les méthodes de détection de toxicité.
Haniyeh Ehsani Oskouie, Christina Chance, Claire Huang
― 6 min lire
Apprends comment la technologie interprète nos voix grâce à l'analyse des ondes sonores.
Nirmal Joshua Kapu, Raghav Karan
― 7 min lire
Comment la quantification à faible bit affecte les grands modèles de langage pendant l'entraînement.
Xu Ouyang, Tao Ge, Thomas Hartvigsen
― 8 min lire
Ce cadre combine des modèles de base avec des modèles linguistiques pour une meilleure reconnaissance des émotions.
Liyun Zhang, Dian Ding, Yu Lu
― 7 min lire
Un nouvel outil aide les profs à choisir rapidement et facilement des livres adaptés pour les élèves.
Jordan J. Bird
― 6 min lire
Apprends comment la représentation du code influence l'efficacité de recherche et les résultats.
Andor Diera, Lukas Galke, Ansgar Scherp
― 7 min lire
Détecter la frustration des utilisateurs peut vraiment améliorer les interactions avec les chatbots et l'expérience client.
Mireia Hernandez Caralt, Ivan Sekulić, Filip Carević
― 8 min lire
GraphJudger nettoie les données pour améliorer la création de Graphes de Connaissances à partir d'infos chaotiques.
Haoyu Huang, Chong Chen, Conghui He
― 8 min lire
Cet article examine l'équité dans les admissions en utilisant des modèles d'apprentissage automatique.
Junhua Liu, Wendy Wan Yee Hui, Roy Ka-Wei Lee
― 7 min lire
Enquêter sur comment les biais influencent les modèles de langage et proposer de nouvelles façons de les mesurer.
Changgeon Ko, Jisu Shin, Hoyun Song
― 9 min lire
ChemSafetyBench teste des chatbots sur la sécurité chimique et les connaissances.
Haochen Zhao, Xiangru Tang, Ziran Yang
― 7 min lire
ER 2Score améliore l'évaluation de la qualité des rapports de radiologie automatisés.
Yunyi Liu, Yingshu Li, Zhanyu Wang
― 6 min lire
Un aperçu de comment l'entraînement 2D Matryoshka améliore la compréhension du texte par les ordinateurs.
Shuai Wang, Shengyao Zhuang, Bevan Koopman
― 7 min lire
Créer un analyseur pour le vietnamien en utilisant des modèles avancés et des ressources améliorées.
Duc-Vu Nguyen, Thang Chau Phan, Quoc-Nam Nguyen
― 9 min lire
Une nouvelle méthode simplifie la synthèse des textes bengalis.
Fahim Morshed, Md. Abdur Rahman, Sumon Ahmed
― 7 min lire
Star Attention améliore la façon dont les modèles linguistiques gèrent les longues séquences de texte.
Shantanu Acharya, Fei Jia, Boris Ginsburg
― 6 min lire