Un nouveau modèle propose un traitement du langage économe en énergie pour les petits appareils.
Kaiwen Tang, Zhanglu Yan, Weng-Fai Wong
― 6 min lire
La science de pointe expliquée simplement
Un nouveau modèle propose un traitement du langage économe en énergie pour les petits appareils.
Kaiwen Tang, Zhanglu Yan, Weng-Fai Wong
― 6 min lire
Derniers articles
Aman Bhargava, Cameron Witkowski, Alexander Detkov
― 6 min lire
Kinjal Basu, Ibrahim Abdelaziz, Kelsey Bradford
― 6 min lire
Tzu-Quan Lin, Guan-Ting Lin, Hung-yi Lee
― 9 min lire
Ashirbad Mishra, Soumik Dey, Marshall Wu
― 6 min lire
Sai Gopinath, Joselyn Rodriguez
― 7 min lire
Explorer l'impact des styles de transcription sur la précision de l'anglais afro-américain.
Annika Heuser, Tyler Kendall, Miguel del Rio
― 5 min lire
Une nouvelle méthode pour évaluer l'incertitude dans les résultats des modèles de langue pour plus de fiabilité.
Yu-Hsiang Wang, Andrew Bai, Che-Ping Tsai
― 8 min lire
Une nouvelle méthode s'attaque au problème de détecter les inexactitudes dans les textes générés par l'IA.
Gabriel Y. Arteaga, Thomas B. Schön, Nicolas Pielawski
― 7 min lire
Les LLMs de discours montrent du potentiel mais galèrent avec l'identification des intervenants dans les conversations.
Junkai Wu, Xulin Fan, Bo-Ru Lu
― 6 min lire
LongLLaVA améliore la compréhension de plusieurs images pour différentes applis.
Xidong Wang, Dingjie Song, Shunian Chen
― 6 min lire
Explorer l'efficacité et l'adaptabilité des modèles de langue grâce à un design modulaire.
Chaojun Xiao, Zhengyan Zhang, Chenyang Song
― 8 min lire
Les départements RH peuvent vraiment profiter d'une représentation des données structurées avec des Graphes de Connaissance.
Azmine Toushik Wasi
― 7 min lire
Un aperçu des méthodes pour rendre les vieux textes plus faciles à lire.
Anton Ehrmanntraut
― 7 min lire
R2GQA aide les étudiants à trouver des réponses aux règles universitaires compliquées de manière efficace.
Phuc-Tinh Pham Do, Duy-Ngoc Dinh Cao, Khanh Quoc Tran
― 11 min lire
CMM-Math évalue la résolution de problèmes mathématiques dans des modèles multimodaux en utilisant du texte et des visuels.
Wentao Liu, Qianjun Pan, Yi Zhang
― 9 min lire
Explorer comment l'apprentissage des préférences améliore l'alignement des modèles de langage avec les attentes humaines.
Bofei Gao, Feifan Song, Yibo Miao
― 11 min lire
On analyse les stratégies de pooling et d'attention dans les modèles d'embedding basés sur les LLM.
Yixuan Tang, Yi Yang
― 7 min lire
Une étude sur l'amélioration des modèles linguistiques en utilisant des articles médicaux ciblés.
Mathieu Laï-king, Patrick Paroubek
― 7 min lire
LoRD améliore l'efficacité des attaques par extraction de modèle sur les grands modèles de langage.
Zi Liang, Qingqing Ye, Yanyun Wang
― 7 min lire
Une étude sur comment les CTAs d'Instagram ont influencé l'engagement des électeurs lors des élections en Allemagne.
Michael Achmann-Denkler, Jakob Fehle, Mario Haim
― 5 min lire
La recherche se concentre sur la génération d'exemples adversariaux pour tester les systèmes d'évaluation de crédibilité.
Włodzimierz Lewoniewski, Piotr Stolarski, Milena Stróżyna
― 8 min lire
Un nouveau jeu de données évalue les compétences des grands modèles de langage à interpréter des représentations visuelles.
Aneta Pawelec, Victoria Sara Wesołowska, Zuzanna Bączek
― 9 min lire
Une étude révèle le rôle des données vocales dans la reconnaissance des émotions chez les hispanophones.
Elena Ortega-Beltrán, Josep Cabacas-Maso, Ismael Benito-Altamirano
― 7 min lire
Une exploration de la montée, de l'influence et du déclin de l'Empire romain.
Luca Santagata, Cristiano De Nobili
― 8 min lire
Examiner comment la langue cache des croyances nuisibles sur les femmes.
Arianna Muti, Federico Ruggeri, Khalid Al-Khatib
― 8 min lire
Exploiter les GCN pour améliorer la classification automatique des questions dans les outils éducatifs.
Junyoung Lee, Ninad Dixit, Kaustav Chakrabarti
― 7 min lire
Une étude sur l'efficacité de différents modèles de langue dans les tâches d'analyse des logs.
Merve Astekin, Max Hort, Leon Moonen
― 6 min lire
Cet article parle des méthodes pour réduire les biais dans les classificateurs de sécurité textuels en utilisant des modèles en ensemble.
Olivia Sturman, Aparna Joshi, Bhaktipriya Radharapu
― 7 min lire
Présentation d'un ensemble de données spécialisé pour suivre les individus et les organisations dans les crimes financiers.
Panagiotis Koletsis, Panagiotis-Konstantinos Gemos, Christos Chronis
― 7 min lire
CA-BERT améliore les réponses des chatbots en comprenant mieux le contexte de la conversation.
Minghao Liu, Mingxiu Sui, Yi Nan
― 6 min lire
Une méthode pour améliorer l'efficacité et la performance des modèles de langue.
Jahyun Koo, Dahoon Park, Sangwoo Jung
― 7 min lire
Un nouveau modèle améliore la classification des relations en utilisant des techniques d'apprentissage avec peu d'exemples.
Miao Fan, Yeqi Bai, Mingming Sun
― 7 min lire
De meilleures invites améliorent la qualité des données tabulaires synthétiques générées par les LLMs.
Banooqa Banday, Kowshik Thopalli, Tanzima Z. Islam
― 8 min lire
Nouveau jeu de données et modèle visent à améliorer la modération de contenu en ligne.
Umut Yildirim, Rohan Dutta, Burak Yildirim
― 9 min lire
Une nouvelle méthode améliore l'efficacité et la précision des grands modèles de langage.
Yang Zhou, Zhuoming Chen, Zhaozhuo Xu
― 8 min lire
Examiner comment les identités sociales influencent les biais dans les modèles de langage.
Wenchao Dong, Assem Zhunis, Dongyoung Jeong
― 7 min lire
Cette étude évalue différents modèles visuels pour comprendre des scènes 3D complexes.
Yunze Man, Shuhong Zheng, Zhipeng Bao
― 12 min lire
Un outil pour analyser rapidement et efficacement les discussions pour les chercheurs.
Yuntian Deng, Wenting Zhao, Jack Hessel
― 7 min lire
Utiliser le RAG avec les LLMs améliore l'efficacité des agents de service client et la précision des réponses.
Sriram Veturi, Saurabh Vaichal, Reshma Lal Jagadheesh
― 7 min lire
Des chercheurs ont développé une technique pour protéger des mots importants dans des données textuelles.
Qingwen Fu
― 6 min lire
Une étude sur l'impact de l'ICL et du SFT sur la structure des modèles linguistiques.
Diego Doimo, Alessandro Serra, Alessio Ansuini
― 8 min lire
Examiner le rôle de l’attention à travers les différentes couches des modèles de langue.
Amit Ben-Artzy, Roy Schwartz
― 6 min lire
Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.
Andy T. Liu, Yi-Cheng Lin, Haibin Wu
― 6 min lire
Une nouvelle approche pour évaluer les modèles de langue de manière efficace.
Lorenzo Pacchiardi, Lucy G. Cheke, José Hernández-Orallo
― 9 min lire
Une étude montre que le réglage des LLM avec des TM améliore la qualité de la traduction pour les organisations.
Inacio Vieira, Will Allred, Séamus Lankford
― 8 min lire