InternLM-Law migliora le risposte a diverse domande legali cinesi con un addestramento avanzato.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
InternLM-Law migliora le risposte a diverse domande legali cinesi con un addestramento avanzato.
― 8 leggere min
Nuove tecniche migliorano le capacità di ragionamento e logica dei grandi modelli linguistici.
― 6 leggere min
Esplorare come i profili utente migliorano la personalizzazione nei modelli di linguaggio.
― 6 leggere min
Uno studio esamina quanto bene gli LLM ragionano con i dati a grafo.
― 6 leggere min
Un nuovo modello migliora il riconoscimento dei riferimenti agli eventi in più documenti.
― 6 leggere min
Un nuovo modello migliora il legame tra comprensione visiva e linguistica.
― 5 leggere min
Esplorando come i sink di attenzione influenzano le prestazioni dei modelli linguistici e introducendo una tecnica di calibrazione.
― 6 leggere min
Questo paper presenta un metodo per valutare i modelli di linguaggio attraverso vari prompt.
― 7 leggere min
Uno studio esplora sistemi che usano immagini e testo per fare previsioni migliori delle etichette.
― 7 leggere min
Uno studio che mette in evidenza l'importanza di annotazioni complete per la valutazione del recupero.
― 6 leggere min
Un nuovo metodo per capire meglio gli eventi usando più documenti.
― 6 leggere min
MIGU migliora l'apprendimento continuo nei modelli linguistici senza bisogno di dati vecchi.
― 7 leggere min
Scopri come gli algoritmi di inferenza migliorano le performance nella generazione di testo.
― 5 leggere min
Questo articolo esamina i problemi di tokenizzazione e propone soluzioni per ridurre i pregiudizi.
― 6 leggere min
Un nuovo metodo per definire le ricompense per gli agenti di apprendimento per rinforzo usando modelli di linguaggio.
― 7 leggere min
Un nuovo approccio migliora i modelli Transformer per una migliore elaborazione dei testi lunghi.
― 6 leggere min
Questa ricerca esplora come le abilità di ragionamento si trasferiscono tra le lingue nei modelli linguistici.
― 8 leggere min
Uno sguardo a come gli embeddings delle frasi migliorano l'elaborazione del linguaggio nell'IA.
― 7 leggere min
Questo documento presenta un metodo per usare LLM per annotare dati tabulari con il minimo sforzo umano.
― 15 leggere min
Questo articolo parla di un metodo per addestrare agenti generalisti usando il linguaggio e la visione.
― 6 leggere min
Esplora come i modelli linguistici memorizzano attraverso la recitazione, la ricostruzione e il ricordo.
― 4 leggere min
Questo studio si concentra su come migliorare le risposte dei modelli puntando su requisiti di lunghezza specifici.
― 6 leggere min
ViANLI presenta nuove sfide per i modelli NLP nell'elaborazione della lingua vietnamita.
― 8 leggere min
Questa ricerca si concentra sul miglioramento del riconoscimento delle entità nominate attraverso strategie di rappresentazione dei dati variate.
― 8 leggere min
Questo articolo esamina come gli embeddings generati da LLM si relazionano ai token chiave nei testi.
― 8 leggere min
Esaminare il comportamento di attenzione insolito nei modelli Transformer.
― 5 leggere min
RAIL unisce l'apprendimento continuo con modelli vision-linguaggio per una migliore adattabilità.
― 8 leggere min
Un nuovo metodo migliora la precisione nella risposta a domande per modelli di linguaggio a scatola nera.
― 5 leggere min
I CMDP combinano la massimizzazione delle ricompense con la sicurezza nelle applicazioni di intelligenza artificiale.
― 6 leggere min
Uno studio sull'uso di modelli di prompt per valutare la traduzione automatica e il riassunto.
― 5 leggere min
Un nuovo sistema migliora l'addestramento dei modelli linguistici di grandi dimensioni con sequenze lunghe.
― 7 leggere min
Un nuovo approccio per classificare i testi generati da esseri umani e da macchine in modo più efficace.
― 4 leggere min
LLaMIPa migliora la capacità dei computer di comprendere le dinamiche della conversazione.
― 7 leggere min
Un nuovo approccio migliora l'estrazione degli eventi causali utilizzando una valutazione incentrata sull'uomo.
― 6 leggere min
Uno sguardo più da vicino su come funzionano i modelli MoE e i loro potenziali benefici.
― 6 leggere min
Un nuovo metodo per migliorare le prestazioni dei modelli linguistici con testi lunghi.
― 5 leggere min
Questo studio valuta quanto bene i grandi modelli di linguaggio utilizzano informazioni esterne.
― 6 leggere min
Un nuovo metodo migliora l'analisi del sentiment affrontando le sfide della scarsità di dati.
― 6 leggere min
Un nuovo modello migliora le capacità di chiamata delle funzioni dei modelli linguistici per compiti complessi.
― 7 leggere min
IDAICL migliora le previsioni affinando la qualità delle dimostrazioni nell'apprendimento contestuale.
― 5 leggere min