Articoli più recenti per Valutazione

Visione artificiale e riconoscimento di modelli Sviluppi nel Fotoritocco degli Smartphone

Un modello per avere foto sempre di qualità su diversi smartphone.

2025-09-18T16:39:24+00:00 ― 8 leggere min

Recupero delle informazioni Migliorare le Raccomandazioni di Moda con Alternative

Introdurre alternative può aumentare la soddisfazione degli utenti nei sistemi di raccomandazione di moda.

2025-09-17T15:30:30+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i LLM nelle competizioni di matematica delle superiori

Un nuovo dataset valuta le capacità dei modelli linguistici nella risoluzione di problemi matematici avanzati.

2025-09-17T08:47:36+00:00 ― 5 leggere min

Ingegneria del software Affrontare la duplicazione di codice tra dataset nella valutazione dei modelli

Esaminando gli effetti della duplicazione di codice tra dataset sulle metriche di prestazione del modello.

2025-09-17T01:33:06+00:00 ― 8 leggere min

Apprendimento automatico Migliorare RAG per la generazione di testi in portoghese brasiliano

Questo studio si concentra sul miglioramento dei metodi di generazione aumentata da recupero per il portoghese brasiliano.

2025-09-17T00:53:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli WAVES: Un nuovo punto di riferimento per il watermarking delle immagini

Questo studio presenta WAVES, un benchmark per valutare le tecniche di watermarking contro vari attacchi.

2025-09-16T13:42:06+00:00 ― 4 leggere min

Calcolo e linguaggio Orion-14B: Una Nuova Era nei Modelli Linguistici

Orion-14B è super nel capire e generare testo multilingue con 14 miliardi di parametri.

2025-09-15T17:49:12+00:00 ― 6 leggere min

Recupero delle informazioni Valutare la persona nei sistemi di dialogo

Nuovi metodi valutano come i sistemi di dialogo mantengono la coerenza della personalità.

2025-09-15T11:14:12+00:00 ― 7 leggere min

Calcolo e linguaggio Un nuovo approccio alla composizione della conoscenza nell'NLP

Questo framework migliora come le conoscenze vengono combinate nei modelli di machine learning per avere prestazioni migliori.

2025-09-14T22:59:30+00:00 ― 8 leggere min

Intelligenza artificiale Usare modelli linguistici per riassumere i rapporti PET

Uno studio rivela che i modelli di linguaggio possono generare impressioni utili per i rapporti PET.

2025-09-14T07:36:21+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i Grandi Modelli Linguistici nella Diagnosi Medica

Valutare l'accuratezza dei LLM nel diagnosticare condizioni mediche da immagini e sintomi.

2025-09-13T23:41:12+00:00 ― 4 leggere min

Calcolo e linguaggio Migliorare la valutazione dell'IA nei referti radiologici

Questa ricerca migliora la valutazione dei report di radiologia generati dall'AI grazie alla collaborazione di esperti.

2025-09-13T18:56:48+00:00 ― 8 leggere min

Computer e società Valutare la sicurezza dell'IA generativa: il ruolo del red-teaming

Analizzando come il red-teaming può migliorare la sicurezza dell'IA e affrontare i rischi potenziali.

2025-09-13T12:13:54+00:00 ― 8 leggere min

Computer e società Affrontare l'amplificazione del danno nei modelli di IA

Esaminando l'amplificazione del danno nei modelli da testo a immagine e il suo impatto sulla società.

2025-09-12T18:11:36+00:00 ― 7 leggere min

Calcolo e linguaggio Allineare i modelli linguistici con le preferenze umane

Questo documento parla di come adattare i modelli linguistici per allinearli ai valori e alle aspettative umane.

2025-09-12T13:03:30+00:00 ― 7 leggere min

Calcolo e linguaggio Presentiamo un Modello Linguistico Aperto e Trasparente

Un nuovo modello linguistico aperto per la ricerca e l'innovazione nel processamento del linguaggio naturale.

2025-09-12T09:14:24+00:00 ― 6 leggere min

Suono Un nuovo sistema per l'anonimizzazione degli speaker

Introducendo un framework flessibile per migliorare la ricerca sulla privacy vocale.

2025-09-12T05:05:10+00:00 ― 7 leggere min

Interazione uomo-macchina EvaLLM: Un Framework per Valutare le Visualizzazioni Generate dall'AI

EvaLLM offre un approccio strutturato per valutare i contenuti visivi generati dall'AI.

2025-09-11T21:07:36+00:00 ― 6 leggere min

Apprendimento automatico Garantire fiducia nel machine learning: un nuovo approccio

Un metodo per verificare i modelli di machine learning per aumentare fiducia e trasparenza.

2025-09-11T16:15:18+00:00 ― 6 leggere min

Calcolo e linguaggio Capire l'IA con SIDU-TXT: Un Nuovo Approccio

SIDU-TXT illumina le decisioni dell'IA nel processamento del linguaggio naturale.

2025-09-11T02:57:24+00:00 ― 6 leggere min

Comunicazione e formazione scientifica Pregiudizi di genere nelle valutazioni della ricerca accademica

La ricerca mostra che le donne affrontano pregiudizi nelle valutazioni e nei finanziamenti in accademia.

2025-09-11T00:05:30+00:00 ― 11 leggere min

Visione artificiale e riconoscimento di modelli Trasformare appunti scritti a mano in inchiostro digitale

Un nuovo metodo trasforma le note scritte a mano in inchiostro digitale per un uso facile.

2025-09-09T20:56:12+00:00 ― 8 leggere min

Ingegneria del software Sfide di riproducibilità nella previsione dei difetti software

Un'analisi dei problemi di riproducibilità nella ricerca sulla previsione dei guasti nel software di deep learning.

2025-09-09T19:21:24+00:00 ― 9 leggere min

Calcolo e linguaggio Affrontare la confusione nei nomi nella generazione di testo

Un nuovo metodo migliora il controllo dei fatti per i testi generati dal computer con nomi ambigui.

2025-09-09T17:30:48+00:00 ― 8 leggere min

Multimedia Progettazione di poster efficace tramite metriche semplici

Impara a progettare manifesti che comunicano messaggi in modo chiaro e attraente.

2025-09-09T08:49:24+00:00 ― 5 leggere min

Apprendimento automatico Affrontare il Reward Hacking nell'addestramento dell'IA

Esplorare le sfide e le soluzioni del reward hacking nell'addestramento dei modelli AI.

2025-09-09T06:58:48+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Nuovo Framework per Valutare i Modelli di Risposta a Domande Visive

Un metodo nuovo per valutare come i modelli rispondono a domande relative alle immagini.

2025-09-09T06:11:24+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i modelli di generazione di espressioni di riferimento

Nuovi metodi migliorano il modo in cui valutiamo i testi generati dai computer.

2025-09-08T20:18:54+00:00 ― 9 leggere min

Intelligenza artificiale Valutare i grandi modelli di linguaggio nella cybersecurity

Uno sguardo dettagliato alla valutazione di CyberMetric degli esperti di AI e umani nella cybersecurity.

2025-09-08T19:39:24+00:00 ― 9 leggere min

Apprendimento automatico Il bisogno di disimparare nelle macchine nell'IA

Affrontare le preoccupazioni etiche tramite la rimozione selettiva della memoria nei modelli di intelligenza artificiale.

2025-09-08T16:53:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Progressi nella generazione di immagini da testo

Esplorare come le macchine creano immagini a partire da testi e si allineano con le preferenze umane.

2025-09-08T11:29:36+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzare nella Personalizzazione nei Modelli Linguistici

Questo studio esamina i benefici delle risposte personalizzate nei modelli linguistici.

2025-09-08T05:02:30+00:00 ― 4 leggere min

Recupero delle informazioni Strategie di Benchmarking per i Sistemi di Raccomandazione

Un nuovo modo per valutare e confrontare gli algoritmi di RecSys usando dataset diversi.

2025-09-07T16:00:24+00:00 ― 16 leggere min

Calcolo e linguaggio Migliorare i Metodi di Valutazione per il Question Answering

Un nuovo sistema per valutare la correttezza delle risposte dell'IA con un giudizio simile a quello umano.

2025-09-07T13:06:36+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare l'istruzione scientifica con i modelli linguistici

I modelli linguistici puntano a migliorare l'apprendimento della scienza offrendo assistenza personalizzata.

2025-09-07T12:27:06+00:00 ― 8 leggere min

Apprendimento automatico Valutare il rilevamento delle anomalie nelle serie temporali con TimeSeriesBench

Un strumento di riferimento per migliorare i metodi di rilevamento delle anomalie nelle serie temporali.

2025-09-07T10:04:54+00:00 ― 7 leggere min

Calcolo e linguaggio Pregiudizio nel Giudizio dei Modelli Linguistici

La ricerca mostra dei bias significativi nelle valutazioni delle risposte tra gli umani e i LLM.

2025-09-07T05:12:36+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare l'AI Medica: Un Nuovo Riferimento per i Med-MLLMs

Questo benchmark valuta le performance dei modelli di linguaggio medico nella sanità.

2025-09-07T01:47:12+00:00 ― 8 leggere min

Calcolo e linguaggio Valutare il ragionamento nei modelli di linguaggio grandi

Un nuovo framework valuta come i LLM ragionano per rispondere a domande complesse.

2025-09-07T00:51:54+00:00 ― 5 leggere min