Cet article passe en revue les méthodes de dropout pour améliorer les performances des petits modèles de langage.
Dylan Hillier, Leon Guertler, Bobby Cheng
― 7 min lire
La science de pointe expliquée simplement
Cet article passe en revue les méthodes de dropout pour améliorer les performances des petits modèles de langage.
Dylan Hillier, Leon Guertler, Bobby Cheng
― 7 min lire
Derniers articles
Arkadeep Acharya, Rudra Murthy, Vishwajeet Kumar
― 6 min lire
Nils Dycke, Matej Zečević, Ilia Kuznetsov
― 7 min lire
Daniel B. Hier, Thanh Son Do, Tayo Obafemi-Ajayi
― 7 min lire
Aleksei S. Krylov, Oleg D. Somov
― 7 min lire
William Van Woensel, Soroor Motie
― 11 min lire
Une nouvelle méthode améliore la manière dont les modèles de langage suivent des instructions complexes.
Kuan Wang, Alexander Bukharin, Haoming Jiang
― 6 min lire
AdaPPA améliore les attaques par jailbreak sur les modèles de langage en combinant des réponses sûres et nuisibles.
Lijia Lv, Weigang Zhang, Xuehai Tang
― 6 min lire
Une nouvelle méthode pour améliorer les maîtres de jeu IA en utilisant les appels de fonction dans les jeux de société.
Jaewoo Song, Andrew Zhu, Chris Callison-Burch
― 7 min lire
Les chercheurs ajustent les LLMs pour améliorer l'honnêteté et la fiabilité des résultats.
Christopher M. Ackerman
― 6 min lire
Les petits modèles ont des avantages uniques en IA, complétant les grands modèles de manière efficace.
Lihu Chen, Gaël Varoquaux
― 9 min lire
Présentation d'un cadre innovant pour tester les interactions des modèles de langage dans des scénarios de jeu de rôle.
Ilya Gusev
― 11 min lire
Cet article parle d'une méthode étape par étape pour améliorer la précision de la traduction.
Eleftheria Briakou, Jiaming Luo, Colin Cherry
― 7 min lire
Les étiquettes de préférence souples améliorent l'alignement des modèles avec les choix humains.
Hiroki Furuta, Kuang-Huei Lee, Shixiang Shane Gu
― 7 min lire
Nouveau modèle améliore la génération de la parole dans différents dialectes des langues à accent tonique.
Kazuki Yamauchi, Yuki Saito, Hiroshi Saruwatari
― 6 min lire
TeXBLEU offre un moyen fiable d'évaluer des expressions LaTeX à partir de maths parlées.
Kyudan Jung, Nam-Joon Kim, Hyongon Ryu
― 7 min lire
Améliorer les capacités de Llama-3 avec un meilleur mélange de langues et des méthodes d'entraînement.
Ningyuan Xi, Yetao Wu, Kun Fan
― 8 min lire
Une étude examine comment les modèles linguistiques traitent l'italien grâce à l'apprentissage multitâche.
Vivi Nastase, Giuseppe Samo, Chunyang Jiang
― 7 min lire
Une nouvelle approche pour réduire les inexactitudes dans les modèles de langage en utilisant le scepticisme.
Yetao Wu, Yihong Wang, Teng Chen
― 7 min lire
Cet article parle des défis et des solutions pour évaluer les modèles de question-réponse ancrés.
Sacha Muller, António Loison, Bilel Omrani
― 13 min lire
Enquête sur comment les modèles de langage gèrent l'accord sujet-verbe dans différentes langues.
Vivi Nastase, Chunyang Jiang, Giuseppe Samo
― 7 min lire
Cette étude évalue comment les LLM traitent les infos en utilisant des données sur les médailles olympiques.
Juhwan Choi, YoungBin Kim
― 6 min lire
Une nouvelle approche améliore la clarté de la recherche en utilisant des graphes de connaissances cognitives et des modèles de langage.
Gollam Rabby, Sören Auer, Jennifer D'Souza
― 7 min lire
Une nouvelle approche pour rendre les modèles de langue concis et efficaces.
Wei Liu, Yang Bai, Chengcheng Han
― 6 min lire
Un nouveau cadre améliore la façon dont les modèles traitent les longs textes.
Zi Yang
― 8 min lire
Un aperçu des dernières avancées dans les modèles de traduction automatique.
Abhinav P. M., SujayKumar Reddy M, Oswald Christopher
― 6 min lire
Examen de la précision de la normalisation des termes dans les grands modèles de langage.
Daniel B. Hier, Thanh Son Do, Tayo Obafemi-Ajayi
― 7 min lire
Explorer comment les LLM peuvent simplifier l'édition de documents structurés avec un minimum d'effort.
Irene Weber
― 9 min lire
Un regard de plus près sur la façon dont les grands modèles de langage réalisent des tâches de base.
Thomas Ball, Shuo Chen, Cormac Herley
― 9 min lire
Utiliser les avis des clients pour créer des expériences de shopping personnalisées avec des en-têtes de recommandations dynamiques.
Shanu Vashishtha, Abhay Kumar, Lalitesh Morishetti
― 9 min lire
Cet article explore des méthodes pour identifier le texte généré par des machines et leurs implications.
Matthieu Dubois, François Yvon, Pablo Piantanida
― 10 min lire
Une nouvelle méthode améliore les capacités des agents à compléter des tâches numériques complexes efficacement.
Zora Zhiruo Wang, Jiayuan Mao, Daniel Fried
― 9 min lire
CoMM améliore l'apprentissage automatique en intégrant efficacement différents types de données.
Benoit Dufumier, Javiera Castillo-Navarro, Devis Tuia
― 8 min lire
Une nouvelle approche pour améliorer l'alignement de l'IA avec les intentions humaines en utilisant des modèles plus simples.
Mehrdad Zakershahrak, Samira Ghodratnama
― 10 min lire
La technologie de l'IA aide les journalistes à déterrer des histoires importantes grâce à l'analyse de données.
Joris Veerbeek, Nicholas Diakopoulos
― 7 min lire
Cette étude examine le lien entre la propagande et la haine dans les mèmes arabes.
Firoj Alam, Md. Rafiul Biswas, Uzair Shah
― 7 min lire
Apprends comment les LLMs automatisent la résumation des avis d'applications utilisateurs.
Faiz Ali Shah, Ahmed Sabir, Rajesh Sharma
― 8 min lire
Utiliser des LLM pour générer des caractéristiques claires à partir de textes scientifiques pour de meilleures prédictions.
Vojtěch Balek, Lukáš Sýkora, Vilém Sklenák
― 8 min lire
Une nouvelle méthode améliore les explications de l'IA grâce à la collaboration entre deux modèles de langage.
Qianli Wang, Tatiana Anikina, Nils Feldhus
― 7 min lire
WikiOFGraph améliore la génération G2T avec des paires texte-graphique de haute qualité.
Daehee Kim, Deokhyung Kang, Sangwon Ryu
― 9 min lire
Des recherches montrent comment les fausses infos impactent la fiabilité et la précision des modèles de langage.
Alina Fastowski, Gjergji Kasneci
― 6 min lire
Une nouvelle méthode interprète les modèles d'attribution d'auteur pour une meilleure précision et confiance.
Milad Alshomary, Narutatsu Ri, Marianna Apidianaki
― 7 min lire
Un nouveau modèle améliore l'évaluation des compétences orales en se concentrant sur la cohérence.
Jiun-Ting Li, Bi-Cheng Yan, Tien-Hong Lo
― 7 min lire
Examinons l'impact des langues de prompt sur les LLM dans les tâches en arabe.
Mohamed Bayan Kmainasi, Rakif Khan, Ali Ezzat Shahroor
― 8 min lire
TheraGen offre une assistance en santé mentale 24h/24 et 7j/7 grâce à une technologie IA de pointe.
Kartikey Doshi, Jimit Shah, Narendra Shekokar
― 8 min lire
Un nouveau cadre améliore la détection des fausses informations sur les plateformes sociales.
Sarah Condran, Michael Bewong, Selasi Kwashie
― 7 min lire