Articoli più recenti per Modelli di Linguaggio

Calcolo e linguaggio Ottimizzare i Prompt per gli Agenti di Modelli Linguistici

Presentiamo RePrompt per migliorare le prestazioni del modello linguistico attraverso prompt ottimizzati.

2025-07-28T08:41:18+00:00 ― 6 leggere min

Calcolo e linguaggio RUPBench: Valutare la Robustezza nei Modelli Linguistici

Un nuovo benchmark valuta come i modelli linguistici gestiscono le modifiche al testo.

2025-07-28T07:06:30+00:00 ― 6 leggere min

Calcolo e linguaggio L'impatto delle personas degli utenti sulle risposte dell'AI

I tratti degli utenti influenzano le risposte dei modelli di linguaggio e la loro sicurezza.

2025-07-27T23:36:12+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare i Modelli di Linguaggio di Grandi Dimensioni con Recupero Aggiuntivo

Un toolkit per valutare le performance dei modelli potenziati dal recupero in specifici settori.

2025-07-27T18:28:06+00:00 ― 10 leggere min

Apprendimento automatico Rilevamento dei Cambiamenti Fase nei Modelli Linguistici

Questo studio rivela come i modelli di linguaggio cambiano comportamento durante l'allenamento.

2025-07-27T13:18:06+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare le abilità di pianificazione nei modelli di linguaggio

Questo articolo esamina modi per migliorare le capacità di pianificazione nei grandi modelli linguistici.

2025-07-27T08:35:36+00:00 ― 8 leggere min

Calcolo e linguaggio DetectBench: Un Nuovo Standard per la Rilevazione di Evidenze nei Modelli Linguistici

DetectBench valuta i LLM sulla loro capacità di individuare prove nascoste nei compiti di ragionamento.

2025-07-27T05:02:18+00:00 ― 6 leggere min

Intelligenza artificiale Attivazione dei neuroni e ragionamento aritmetico nei LLMs

Esaminando come l'attivazione dei neuroni migliora il ragionamento aritmetico nei grandi modelli linguistici.

2025-07-27T00:17:54+00:00 ― 9 leggere min

Calcolo e linguaggio Avanzando la generazione di poesia in ceco

Un nuovo modello genera poesia ceca con rime e ritmi migliorati.

2025-07-26T22:43:06+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare il ragionamento nei modelli di linguaggio

Un nuovo benchmark valuta le capacità di ragionamento nei modelli linguistici.

2025-07-26T22:11:30+00:00 ― 8 leggere min

Calcolo e linguaggio Ragioni nel Ranking degli Argomenti da parte dei Modelli Linguistici

Uno studio su come i modelli linguistici generano ragionamenti persuasivi per la valutazione degli argomenti.

2025-07-26T20:52:30+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'onestà nei modelli di linguaggio grandi

Questo studio valuta l'onestà dei LLM in tre aree chiave.

2025-07-26T14:33:18+00:00 ― 6 leggere min

Calcolo e linguaggio Le sfide della collaborazione tra modelli linguistici

Quest'articolo esplora come gli avversari influenzano il lavoro di squadra tra i modelli linguistici.

2025-07-26T11:00:00+00:00 ― 12 leggere min

Calcolo e linguaggio Valutare modelli linguistici multilingue nelle lingue indiche

Uno studio completo sulle performance dei modelli linguistici in 10 lingue indiche.

2025-07-25T17:37:12+00:00 ― 8 leggere min

Apprendimento automatico Tecniche di riparazione del codice avanzate per linguaggi meno comuni

Un nuovo metodo migliora la riparazione del codice per linguaggi di programmazione poco usati.

2025-07-25T15:07:06+00:00 ― 7 leggere min

Apprendimento automatico L'attenzione affonda nei modelli linguistici

Esplorando come i sink di attenzione influenzano le prestazioni dei modelli linguistici e introducendo una tecnica di calibrazione.

2025-07-25T11:02:12+00:00 ― 6 leggere min

Calcolo e linguaggio RankAdaptor: Una Nuova Frontiera nella Compressione dei Modelli

RankAdaptor ottimizza il fine-tuning per i modelli AI potati, migliorando le prestazioni in modo efficiente.

2025-07-25T10:30:36+00:00 ― 8 leggere min

Calcolo e linguaggio Affrontare il plagio nei modelli di linguaggio di grandi dimensioni

Uno studio su PlagBench e il suo ruolo nel rilevare il plagio nei risultati delle LLM.

2025-07-25T09:43:12+00:00 ― 4 leggere min

Calcolo e linguaggio Valutare il ragionamento logico a più passaggi nei modelli linguistici

Nuovo dataset valuta la capacità dei LLM di affrontare compiti di ragionamento logico complesso.

2025-07-25T01:57:06+00:00 ― 7 leggere min

Calcolo e linguaggio Esaminando il trasferimento linguistico nei compiti di ragionamento

Questa ricerca esplora come le abilità di ragionamento si trasferiscono tra le lingue nei modelli linguistici.

2025-07-24T21:20:36+00:00 ― 8 leggere min

Apprendimento automatico Il Ruolo dell'Auto-Correzione nei Modelli di Linguaggio AI

Questo articolo parla di come i modelli di intelligenza artificiale imparano dagli errori attraverso l’autocorrezione.

2025-07-24T21:04:16+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare la Comprensione delle Direzioni Cardinali nei Grandi Modelli Linguistici

Questo studio valuta quanto bene i LLM ragionano sulle direzioni cardinali.

2025-07-24T19:53:42+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare i LLM in decisioni sequenziali attraverso l'UNO Arena

Questo studio valuta quanto bene i LLM gestiscono il processo decisionale in un contesto di gioco.

2025-07-24T18:34:42+00:00 ― 8 leggere min

Calcolo e linguaggio Esaminare le prestazioni del modello linguistico tra i gruppi di utenti

Uno studio rivela come le caratteristiche degli utenti influenzano le risposte e l'accuratezza dei LLM.

2025-07-24T12:47:06+00:00 ― 8 leggere min

Calcolo e linguaggio CharED: Un Nuovo Metodo per Migliorare i Modelli Linguistici

CharED combina modelli linguistici per prestazioni migliori senza vocabolari condivisi.

2025-07-24T05:48:24+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nei Sistemi RAG: Un Nuovo Quadro di Valutazione

RAGBench presenta un dataset completo per valutare i sistemi di Generazione Augmentata da Recupero.

2025-07-24T05:24:42+00:00 ― 7 leggere min

Calcolo e linguaggio Sfide di equità nei grandi modelli linguistici

Esplorando i problemi di equità nei modelli di linguaggio AI e le loro implicazioni.

2025-07-24T05:13:00+00:00 ― 9 leggere min

Calcolo e linguaggio Nuovo Strumento di Moderazione per Modelli Linguistici

Introduzione di uno strumento per migliorare la sicurezza nelle interazioni con i modelli linguistici.

2025-07-24T00:08:42+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare gli Errori Silenziosi negli Strumenti dei Modelli Linguistici

Questo articolo esplora la rilevazione degli errori negli strumenti utilizzati dai modelli linguistici.

2025-07-23T09:39:42+00:00 ― 6 leggere min

Calcolo e linguaggio Esaminando i modelli sintattici nei modelli linguistici

Quest'articolo analizza le strutture ripetitive nei testi generati dai modelli di linguaggio.

2025-07-23T01:29:54+00:00 ― 8 leggere min

Calcolo e linguaggio Valutazione del seguito di istruzioni sequenziali nei LLM

Un nuovo benchmark valuta quanto bene i modelli linguistici seguono più istruzioni in sequenza.

2025-07-22T21:32:54+00:00 ― 4 leggere min

Calcolo e linguaggio Testare Grandi Modelli Linguistici con MalAlgoQA

Il dataset MalAlgoQA valuta il ragionamento dei Grandi Modelli Linguistici in scenari controfattuali.

2025-07-22T07:35:30+00:00 ― 6 leggere min

Intelligenza artificiale MathCAMPS: Un Nuovo Approccio per Valutare i Modelli di Linguaggio

MathCAMPS offre un modo nuovo per valutare il ragionamento matematico nei modelli linguistici.

2025-07-22T06:56:00+00:00 ― 10 leggere min

Calcolo e linguaggio Migliorare la Rappresentazione Numerica nei Modelli Linguistici

Questo lavoro si concentra su una migliore rappresentazione dei numeri usando embedding dei digit per previsioni più accurate.

2025-07-22T06:48:06+00:00 ― 8 leggere min

Apprendimento automatico Valutare Grandi Modelli Linguistici in Dueling Bandits

Esplorare l'efficacia dei LLM nella presa di decisioni attraverso scenari di Dueling Bandits.

2025-07-21T23:41:30+00:00 ― 8 leggere min

Calcolo e linguaggio Valutare i modelli linguistici per la ricerca scientifica

Un nuovo benchmark per valutare i modelli linguistici di grandi dimensioni nei test di ipotesi.

2025-07-21T19:52:24+00:00 ― 7 leggere min

Intelligenza artificiale Presentiamo CRAB: Un Nuovo Standard per i Modelli Linguistici

CRAB migliora i test per i modelli linguistici in ambienti reali.

2025-07-21T18:41:18+00:00 ― 7 leggere min

Apprendimento automatico Avanzamento del fine-tuning on-device per modelli di linguaggio

Ottimizzazione di grandi modelli di linguaggio direttamente sugli smartphone, proteggendo i dati degli utenti.

2025-07-21T08:40:54+00:00 ― 6 leggere min

Intelligenza artificiale Decifrare l'Interpretabilità Meccanica nei Modelli Trasformatori

Una panoramica dell'interpretabilità meccanicistica nei modelli linguistici basati su trasformatori.

2025-07-21T02:05:54+00:00 ― 8 leggere min

Calcolo e linguaggio Riformulare Prospettive: Spunti da r/ChangeMyView

Esplorando come il riformulare cambia le opinioni attraverso discussioni di comunità.

2025-07-21T01:34:18+00:00 ― 5 leggere min