Un approccio fresco mette in evidenza token sorprendenti per valutare i dati di addestramento dei modelli di linguaggio.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un approccio fresco mette in evidenza token sorprendenti per valutare i dati di addestramento dei modelli di linguaggio.
― 6 leggere min
Questo studio esplora metodi per migliorare i modelli di lingua italiana in settori specializzati.
― 9 leggere min
Un nuovo metodo migliora la resistenza alle manomissioni nei modelli di linguaggio a peso aperto.
― 8 leggere min
Migliorare modelli linguistici più piccoli come MiniCPM attraverso pratiche di fine-tuning efficaci.
― 6 leggere min
Il benchmark valuta la capacità dei modelli linguistici di comprendere le relazioni spaziali.
― 5 leggere min
Un nuovo metodo analizza i modelli linguistici esaminando le loro caratteristiche specifiche.
― 5 leggere min
Questo articolo esplora come la generazione strutturata influisce sul ragionamento e sulla comprensione dei modelli linguistici.
― 5 leggere min
OpenFactCheck offre un framework per valutare l'accuratezza delle uscite dei modelli linguistici.
― 6 leggere min
Metodi innovativi per migliorare l'equità nei modelli di linguaggio grandi.
― 7 leggere min
Un nuovo metodo migliora la qualità dei dati sintetici per un migliore allineamento dei modelli linguistici.
― 6 leggere min
Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.
― 6 leggere min
SAGE-RT crea dati sintetici per migliorare le valutazioni di sicurezza dei modelli linguistici.
― 6 leggere min
ArabLegalEval valuta le performance dei LLM nella gestione delle informazioni legali arabe.
― 6 leggere min
Un nuovo metodo per valutare i risultati dei modelli linguistici usando più giudici LLM.
― 7 leggere min
Un nuovo benchmark valuta gli agenti dei modelli linguistici per gestire l'analisi dei dati scientifici.
― 8 leggere min
Nuovi metodi migliorano l'accuratezza dei piccoli modelli nel rispondere a domande sulle telecomunicazioni.
― 6 leggere min
ConflictBank offre spunti sui conflitti di conoscenza nei modelli linguistici.
― 6 leggere min
Questo articolo esplora il ruolo della memorizzazione nel migliorare le performance dell'ICL.
― 6 leggere min
Presentiamo un nuovo modello e benchmark per l'elaborazione del testo russo.
― 6 leggere min
I ricercatori stanno esaminando l'affidabilità delle metriche per la sicurezza dei modelli di linguaggio.
― 6 leggere min
Un'analisi approfondita su come la previsione del prossimo token influisce sulla comprensione del linguaggio nei modelli.
― 6 leggere min
FPDT offre una soluzione per addestrare LLM a lungo contesto in modo più efficiente.
― 6 leggere min
MemLong migliora la capacità dei modelli di linguaggio di gestire testi lunghi in modo efficace.
― 7 leggere min
Questo articolo analizza come i modelli di linguaggio creano reti sociali realistici e i loro pregiudizi.
― 6 leggere min
Questo articolo parla di un nuovo framework per migliorare il ragionamento nei modelli di intelligenza artificiale.
― 6 leggere min
Presentiamo un framework per generare elementi di test sulla creatività usando modelli linguistici.
― 6 leggere min
Un nuovo metodo migliora l'elaborazione dei testi lunghi nei modelli linguistici per risposte migliori.
― 5 leggere min
LongGenBench valuta i modelli di linguaggio grandi nella generazione di testi lunghi di alta qualità.
― 6 leggere min
RAG è fondamentale per ottimizzare le risposte dei modelli linguistici, soprattutto con testi lunghi.
― 6 leggere min
Questo articolo valuta l'efficacia degli autoencoder sparsi nella rappresentazione della conoscenza sulle città.
― 5 leggere min
Uno studio sull'impatto di ICL e SFT sulla struttura del modello linguistico.
― 6 leggere min
Uno studio mostra che affinare i LLM con TM migliora la qualità della traduzione per le organizzazioni.
― 7 leggere min
Questo articolo parla degli MLSAE e del loro ruolo nell'analizzare i livelli dei modelli di linguaggio.
― 6 leggere min
ECHO combina diversi schemi di ragionamento per risolvere meglio i problemi nei modelli di linguaggio.
― 6 leggere min
Lo studio valuta i modelli di linguaggio sulla loro capacità di generare codice per applicazioni web.
― 6 leggere min
AdaPPA migliora gli attacchi jailbreak sui modelli di linguaggio combinando risposte sicure e dannose.
― 5 leggere min
PF-PPO migliora i modelli linguistici filtrando le ricompense inaffidabili per ottenere risposte di codice migliori.
― 5 leggere min
Lo studio analizza come i modelli linguistici elaborano l'italiano tramite l'apprendimento multi-task.
― 6 leggere min
Investigando come i modelli di linguaggio gestiscono l'accordo soggetto-verbo in diverse lingue.
― 5 leggere min
Un nuovo modo per rendere i modelli linguistici più concisi ed efficaci.
― 5 leggere min