Questo studio valuta le prestazioni dei LLM con la lingua persiana.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio valuta le prestazioni dei LLM con la lingua persiana.
― 5 leggere min
La ricerca evidenzia le vulnerabilità dei sistemi MNMT agli attacchi backdoor.
― 8 leggere min
Uno studio su come T5 elabora dati strutturati per query SQL.
― 12 leggere min
LP++ migliora l'adattamento dei modelli vision-language, soprattutto negli scenari di few-shot learning.
― 6 leggere min
Esplora come il Mixture-of-Depths migliora l'efficienza dei modelli linguistici in modo sostenibile.
― 7 leggere min
Uno studio mostra che modelli più piccoli funzionano bene con dati di addestramento semplificati.
― 7 leggere min
Un nuovo metodo di allenamento migliora la composizionalità dei modelli di visione-linguaggio.
― 6 leggere min
Un nuovo approccio per migliorare il topic modeling usando relazioni basate su grafi.
― 8 leggere min
Un nuovo dataset misura i sistemi RAG per rispondere alle domande in modo preciso.
― 6 leggere min
I nuovi modelli migliorano le capacità di ragionamento in vari compiti, aumentando le performance dell'AI.
― 7 leggere min
Un nuovo metodo migliora la risoluzione della coreferenza degli eventi per una migliore comprensione del testo.
― 6 leggere min
Un modo strutturato per valutare i modelli linguistici in contesti multilingue.
― 6 leggere min
Esaminando la distinzione uso-menzione nel discorso online.
― 6 leggere min
Integrare il ragionamento umano nell'addestramento dell'IA migliora le spiegazioni del modello e crea fiducia.
― 7 leggere min
Combinare linguaggio e navigazione migliora come i robot funzionano in vari ambienti.
― 7 leggere min
Una panoramica dei diversi metodi di apprendimento usati dai modelli linguistici.
― 6 leggere min
Un nuovo framework migliora i modelli linguistici riconoscendo e rispondendo a diversi stili di linguaggio.
― 8 leggere min
Un nuovo dataset migliora la capacità dei LLM di seguire istruzioni complesse.
― 5 leggere min
AQuA misura la qualità dei commenti usando le opinioni di esperti e utenti.
― 5 leggere min
DIBS migliora i sottotitoli degli eventi video perfezionando i confini usando dati non etichettati.
― 8 leggere min
Quest'articolo analizza come gli attacchi avversari compromettano i modelli di classificazione del testo.
― 6 leggere min
Esaminare come l'incertezza influisce sulla presa di decisioni nei modelli di linguaggio di grandi dimensioni.
― 7 leggere min
MGFiD migliora l'accuratezza e l'efficienza nel rispondere a domande su argomenti vari.
― 5 leggere min
Nuovi metodi migliorano l'elaborazione del linguaggio in diverse lingue.
― 8 leggere min
Metodi innovativi per addestrare modelli usando testo compresso.
― 5 leggere min
Nuovi modelli linguistici progettati per diverse lingue nel Sud-Est asiatico mostrano risultati promettenti.
― 5 leggere min
Questo lavoro si concentra sul trovare scene importanti per migliorare i riassunti delle sceneggiature dei film.
― 6 leggere min
Questo studio esamina i metodi per mantenere la privacy nei compiti di elaborazione del linguaggio.
― 7 leggere min
Un nuovo metodo migliora il collegamento degli eventi nei testi usando il ragionamento generato dall'IA.
― 7 leggere min
Il dataset KazQAD migliora le capacità di risposta alle domande in lingua kazaka.
― 6 leggere min
Un nuovo metodo migliora la segmentazione delle immagini usando descrizioni testuali e coppie di immagini.
― 5 leggere min
BEAR migliora la valutazione della conoscenza relazionale nei modelli di linguaggio.
― 9 leggere min
Migliorando l'accuratezza del modello sistemando i problemi nei dati di ingresso.
― 7 leggere min
Un dataset che esamina come le persone giudicano la plausibilità degli eventi in base al linguaggio.
― 5 leggere min
Migliorare i programmi informatici per risolvere problemi di matematica con parole attraverso esempi di dati migliori.
― 7 leggere min
Questo articolo esplora l'integrazione del controllo PID nei trasformatore per migliorare la robustezza e la qualità dell'output.
― 7 leggere min
Questo articolo esamina i metodi per generare domande per migliorare l'estrazione degli argomenti degli eventi.
― 6 leggere min
I nuovi modelli puntano a migliorare l'accuratezza nell'analizzare i dati delle sperimentazioni cliniche.
― 6 leggere min
Questo documento parla di come personalizzare i LLM usando metodi di recupero per avere interazioni migliori con gli utenti.
― 5 leggere min
LLM2Vec migliora i modelli solo decoder per una migliore elaborazione del linguaggio.
― 6 leggere min