Questo studio affronta le sfide nei modelli audio per le lingue a basso supporto.
Potsawee Manakul, Guangzhi Sun, Warit Sirichotedumrong
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio affronta le sfide nei modelli audio per le lingue a basso supporto.
Potsawee Manakul, Guangzhi Sun, Warit Sirichotedumrong
― 6 leggere min
Esaminando come i modelli linguistici apprendono conoscenze fattuali e i loro limiti.
Xiao Zhang, Miao Li, Ji Wu
― 7 leggere min
Il metodo GroupDebate riduce i costi mentre migliora l'accuratezza nelle discussioni tra agenti.
Tongxuan Liu, Xingyu Wang, Weizhe Huang
― 6 leggere min
Questo studio migliora i sistemi di riconoscimento delle emozioni per lingue meno comuni usando dati ad alta risorsa.
Hsi-Che Lin, Yi-Cheng Lin, Huang-Cheng Chou
― 7 leggere min
Questo documento valuta quanto bene i modelli linguistici spiegano i concetti scientifici.
Prasoon Bajpai, Niladri Chatterjee, Subhabrata Dutta
― 5 leggere min
Il pooling dei token migliora lo stoccaggio dei dati mantenendo la precisione del recupero.
Benjamin Clavié, Antoine Chaffin, Griffin Adams
― 6 leggere min
Un modello migliora i compiti di parlare in contesti multilingue, affrontando le sfide del code-switching.
Jing Xu, Daxin Tan, Jiaqi Wang
― 6 leggere min
Un nuovo approccio migliora l'apprendimento dei robot combinando istruzioni linguistiche dettagliate con i dati.
Yinpei Dai, Jayjun Lee, Nima Fazeli
― 6 leggere min
Uno studio sulle performance dei LLM usando l'istruzione di tuning e l'apprendimento in contesto.
Taihang Wang, Xiaoman Xu, Yimin Wang
― 6 leggere min
Un nuovo modello migliora l'efficienza nella raccolta di dati linguistici durante il lavoro sul campo.
Aso Mahmudi, Borja Herce, Demian Inostroza Amestica
― 6 leggere min
Questo studio analizza come i modelli di linguaggio creano titoli efficaci per articoli di ricerca partendo dagli abstract.
Tohida Rehman, Debarshi Kumar Sanyal, Samiran Chattopadhyay
― 5 leggere min
Questo studio esamina l'efficacia degli Sparse Autoencoders nel comprendere le caratteristiche dei modelli linguistici.
David Chanin, James Wilken-Smith, Tomáš Dulka
― 6 leggere min
PODA migliora la capacità dell'IA di capire i testi e ragionare in modo logico.
Chenxu Wang, Ping Jian, Zhen Yang
― 6 leggere min
Un nuovo framework semplifica il design della microstruttura usando comandi in linguaggio naturale.
Nikita Kartashov, Nikolaos N. Vlassis
― 8 leggere min
Questa ricerca esplora l'efficacia dei LLM in diverse lingue oltre l'inglese.
Daoyang Li, Mingyu Jin, Qingcheng Zeng
― 6 leggere min
La ricerca dimostra che l'IA può prevedere le posizioni degli utenti dai post indiretti sui social media.
Siyuan Brandon Loh, Liang Ze Wong, Prasanta Bhattacharya
― 6 leggere min
Questo articolo esamina come i diversi strati influenzano le prestazioni degli LLM.
Yang Zhang, Yanfei Dong, Kenji Kawaguchi
― 5 leggere min
Uno studio su come gli agenti AI seguono le regole definite dagli utenti utilizzando il dataset ACS.
Lior Madmoni, Amir Zait, Ilia Labzovsky
― 9 leggere min
CADA-GAN migliora le performance dei sistemi ASR in vari ambienti di registrazione.
Chien-Chun Wang, Li-Wei Chen, Cheng-Kang Chou
― 6 leggere min
Nuovi metodi migliorano le prestazioni degli LLM comprimendo l'input dei token.
Runsong Zhao, Pengcheng Huang, Xinyu Liu
― 5 leggere min
MQM-APE migliora la qualità delle valutazioni di traduzione automatica tramite un'analisi avanzata degli errori.
Qingyu Lu, Liang Ding, Kanjian Zhang
― 7 leggere min
Questo studio valuta quanto bene i LLM capiscono i tropi narrativi nei riassunti dei film.
Hung-Ting Su, Ya-Ching Hsu, Xudong Lin
― 4 leggere min
Il metodo FLEX offre un nuovo approccio per valutare con precisione i sistemi text-to-SQL.
Heegyu Kim, Taeyang Jeon, Seunghwan Choi
― 6 leggere min
Nuove funzionalità migliorano l'esperienza dell'utente nella comprensione dello schermo e nelle interazioni multilingue.
Naman Goyal
― 6 leggere min
Usare la tecnologia per raccogliere informazioni sui tratti delle piante in modo veloce dal web.
Diego Marcos, Robert van de Vlasakker, Ioannis N. Athanasiadis
― 4 leggere min
EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.
Yihan Wu, Yifan Peng, Yichen Lu
― 5 leggere min
Un nuovo modello migliora gli embedding testuali attraverso strategie di apprendimento contestuale.
Chaofan Li, MingHao Qin, Shitao Xiao
― 5 leggere min
Un nuovo metodo punta a ridurre la perdita semantica negli embeddings di frasi cross-lingual.
Dayeon Ki, Cheonbok Park, Hyunjoong Kim
― 5 leggere min
I nuovi modelli puntano a combattere il linguaggio dannoso online con tecniche di rilevamento avanzate.
Tonmoy Roy, Md Robiul Islam, Asif Ahammad Miazee
― 6 leggere min
QualIT migliora l'analisi del testo unendo modelli linguistici e tecniche di clustering.
Satya Kapoor, Alex Gil, Sreyoshi Bhaduri
― 6 leggere min
Questo studio esplora il ruolo dell'IA nei consigli per la negoziazione salariale e i potenziali pregiudizi.
R. Stuart Geiger, Flynn O'Sullivan, Elsie Wang
― 5 leggere min
Un nuovo framework migliora la qualità del dialogo nei chatbot educativi per un apprendimento efficace.
Haoyu Huang, Tong Niu, Rui Yang
― 7 leggere min
Questa ricerca esamina le performance dei LLM nelle attività cognitive simili al comportamento dei neonati.
Pengrui Han, Peiyang Song, Haofei Yu
― 6 leggere min
Un nuovo strumento valuta le prestazioni dei modelli di linguaggio su diversi tipi di dati.
Yizhi Li, Ge Zhang, Yinghao Ma
― 5 leggere min
Questo articolo presenta un nuovo framework per migliorare le tecniche di inferenza nei modelli linguistici.
Jon Saad-Falcon, Adrian Gamarra Lafuente, Shlok Natarajan
― 5 leggere min
Un nuovo metodo migliora l'accuratezza nell'estrazione dei tripli aspetto-sentimento.
Iwo Naglik, Mateusz Lango
― 6 leggere min
Un nuovo framework migliora la creazione di prompt per i modelli di linguaggio grandi.
Mingqi Li, Karan Aggarwal, Yong Xie
― 6 leggere min
Questo studio valuta vari modelli per recuperare informazioni cliniche in modo efficace.
Skatje Myers, Timothy A. Miller, Yanjun Gao
― 7 leggere min
Un nuovo metodo migliora le prestazioni di Flash Attention per maschere di attenzione sparse.
Agniv Sharma, Jonas Geiping
― 5 leggere min
Una nuova metrica che migliora la valutazione della coerenza fattuale nei riassunti automatici.
Yuxuan Ye, Edwin Simpson, Raul Santos Rodriguez
― 5 leggere min