Una nuova tecnica riduce il fabbisogno di memoria per i grandi modelli di linguaggio mantenendo le prestazioni.
Luning Wang, Shiyao Li, Xuefei Ning
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Una nuova tecnica riduce il fabbisogno di memoria per i grandi modelli di linguaggio mantenendo le prestazioni.
Luning Wang, Shiyao Li, Xuefei Ning
― 5 leggere min
Un nuovo metodo migliora l'efficienza nel gestire input lunghi per i modelli di linguaggio.
Di Liu, Meng Chen, Baotong Lu
― 5 leggere min
Un nuovo metodo migliora la capacità di presa dei robot usando comandi in linguaggio naturale.
Vineet Bhat, Prashanth Krishnamurthy, Ramesh Karri
― 6 leggere min
Un nuovo modello di embedding testuale sembra promettente nei compiti e nelle prestazioni multilingue.
Saba Sturua, Isabelle Mohr, Mohammad Kalim Akram
― 8 leggere min
Uno sguardo a come IRL migliora le performance e la diversità dei modelli linguistici.
Markus Wulfmeier, Michael Bloesch, Nino Vieillard
― 8 leggere min
Un nuovo benchmark mira a migliorare la valutazione dell'incertezza nei modelli linguistici.
Pei-Fu Guo, Yun-Da Tsai, Shou-De Lin
― 5 leggere min
SelECT-SQL aumenta l'accuratezza nella conversione del linguaggio naturale in query SQL.
Ke Shen, Mayank Kejriwal
― 8 leggere min
Un nuovo metodo migliora il ragionamento del modello attraverso tracce di programmazione strutturata.
Cassandra A. Cohen, William W. Cohen
― 8 leggere min
Un nuovo metodo migliora il flusso della conversazione usando più documenti come fonti.
Young-Suk Lee, Chulaka Gunasekara, Danish Contractor
― 6 leggere min
Un nuovo metodo migliora la selezione dei dati per l'addestramento dei modelli linguistici.
Simon Yu, Liangyu Chen, Sara Ahmadian
― 9 leggere min
Un nuovo modo per migliorare il ragionamento nei dati delle serie temporali.
Winnie Chow, Lauren Gardiner, Haraldur T. Hallgrímsson
― 6 leggere min
THaMES offre un framework per ridurre le allucinazioni nei modelli linguistici.
Mengfei Liang, Archish Arun, Zekun Wu
― 6 leggere min
Un metodo per migliorare la comprensione dei documenti usando modelli più piccoli addestrati da quelli più grandi.
Marcel Lamott, Muhammad Armaghan Shakir
― 5 leggere min
Valutare l'impatto dei metodi di compressione sulle prestazioni dei modelli linguistici.
Bishwash Khanal, Jeffery M. Capone
― 6 leggere min
Un nuovo framework migliora le prestazioni dei modelli affrontando l'affidabilità del feedback.
Jianing Wang, Yang Zhou, Xiaocheng Zhang
― 7 leggere min
I ricercatori presentano Blind-VaLM, che migliora i modelli linguistici con conoscenze visive in modo efficiente.
Paula Ontalvilla, Aitor Ormazabal, Gorka Azkune
― 7 leggere min
Semformer integra la pianificazione nei modelli di linguaggio, migliorando precisione ed efficienza.
Yongjing Yin, Junran Ding, Kai Song
― 6 leggere min
Questo studio valuta come i modelli QA gestiscono il rumore nei dati di input.
Asir Saadat, Nahian Ibn Asad, Md Farhan Ishmam
― 7 leggere min
Il metodo TRIM riduce i token delle immagini nei modelli di linguaggio multimodali mantenendo le prestazioni.
Dingjie Song, Wenjun Wang, Shunian Chen
― 5 leggere min
Una panoramica sulle tecnologie di riconoscimento delle parole chiave e le loro sfide con la lingua urdu.
Syed Muhammad Aqdas Rizvi
― 6 leggere min
Questo articolo esplora come le rappresentazioni relative migliorano la comunicazione dell'IA e la sua adattabilità ai compiti.
Alejandro García-Castellanos, Giovanni Luca Marchetti, Danica Kragic
― 6 leggere min
Un nuovo metodo migliora l'efficienza nel fine-tuning dei modelli di linguaggio.
Md Kowsher, Nusrat Jahan Prottasha, Prakash Bhat
― 5 leggere min
GenCRF migliora la riformulazione delle query di ricerca per una maggiore precisione nell'intento dell'utente.
Wonduk Seo, Haojie Zhang, Yueyang Zhang
― 6 leggere min
Attention-Seeker migliora l'estrazione delle parole chiave usando le mappe di autoattenzione dei modelli linguistici.
Erwin D. López Z., Cheng Tang, Atsushi Shimada
― 9 leggere min
Presentiamo CREAM, un framework per valutazioni efficaci dei riassunti delle riunioni senza testi di riferimento.
Ziwei Gong, Lin Ai, Harshsaiprasad Deshpande
― 6 leggere min
VERA migliora la precisione e la rilevanza delle risposte dei modelli linguistici.
Nitin Aravind Birur, Tanay Baswa, Divyanshu Kumar
― 5 leggere min
Un nuovo modo per migliorare la trasparenza nelle risposte e nelle decisioni dell'IA.
Christos Fragkathoulas, Odysseas S. Chlapanis
― 7 leggere min
Un nuovo metodo per migliorare i LLM arabi usando conoscenze strutturate per risposte migliori.
Muhammad Asif Ali, Nawal Daftardar, Mutayyaba Waheed
― 5 leggere min
Il framework ARTICLE migliora la qualità dei dati nel trattamento del linguaggio naturale grazie alla coerenza interna.
Sujan Dutta, Deepak Pandita, Tharindu Cyril Weerasooriya
― 6 leggere min
Nuovi modelli migliorano le prestazioni con esperti di diverse dimensioni.
Manxi Sun, Wei Liu, Jian Luan
― 6 leggere min
La ricerca si concentra sul migliorare la capacità dei modelli linguistici di capire testi più lunghi.
Yi Lu, Jing Nathan Yan, Songlin Yang
― 9 leggere min
YORO semplifica la generazione di SQL da linguaggio naturale, migliorando l'efficienza e la precisione.
Hideo Kobayashi, Wuwei Lan, Peng Shi
― 6 leggere min
Un nuovo benchmark migliora la valutazione dei sistemi di rilevamento delle parafrasi.
Andrianos Michail, Simon Clematide, Juri Opitz
― 5 leggere min
Un nuovo modello migliora il modo in cui i modelli linguistici pensano e rispondono.
Ningyuan Xi, Xiaoyu Wang, Yetao Wu
― 5 leggere min
Uno sguardo ai metodi per rilevare dati imprevisti nei modelli di intelligenza artificiale.
Shuo Lu, Yingsheng Wang, Lijun Sheng
― 7 leggere min
Uno sguardo ai metodi migliorati per riassumere il testo in modo efficiente.
Yuping Wu, Hao Li, Hongbo Zhu
― 6 leggere min
Esaminando il ruolo e la precisione dei LLM nelle ricerche legali.
Rajaa El Hamdani, Thomas Bonald, Fragkiskos Malliaros
― 5 leggere min
TART migliora i compiti di ragionamento sulle tabelle usando strumenti specializzati e modelli linguistici grandi.
Xinyuan Lu, Liangming Pan, Yubo Ma
― 5 leggere min
Un nuovo metodo per migliorare la risposta dei modelli di linguaggio ai comandi degli utenti.
Pedro Luiz Silva, Antonio de Domenico, Ali Maatouk
― 2 leggere min
Michelangelo valuta i modelli di linguaggio sulla loro capacità di ragionare attraverso contesti lunghi.
Kiran Vodrahalli, Santiago Ontanon, Nilesh Tripuraneni
― 4 leggere min