Articoli più recenti per Valutazione del modello

Visione artificiale e riconoscimento di modelli Ripensare i metodi di valutazione per i modelli multimodali

Nuovo benchmark migliora la valutazione dei modelli multimodali minimizzando i bias.

2025-07-22T12:12:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Valutare l'apprendimento multimodale nei modelli di linguaggio

Questo studio esamina come i dati visivi e testuali influenzano le prestazioni del modello.

2025-07-22T07:03:54+00:00 ― 7 leggere min

Intelligenza artificiale Decomposizione Contestuale: Una Nuova Prospettiva per i Transformer

CD-T migliora la comprensione dei modelli transformer, aumentando l'interpretazione e la fiducia.

2025-07-22T06:40:12+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Misurare il Bias di Genere nei Grandi Modelli Vision-Linguistici

Nuovo benchmark valuta il bias di genere nei modelli di intelligenza artificiale legati ai ruoli lavorativi.

2025-07-22T01:40:00+00:00 ― 6 leggere min

Apprendimento automatico Affrontare gli attacchi backdoor clean-label nel machine learning

Esaminando le vulnerabilità degli attacchi backdoor a etichetta pulita e come i limiti di generalizzazione possono essere d'aiuto.

2025-07-21T22:58:40+00:00 ― 6 leggere min

Multimedia OpenVNA: Potenziare la Comprensione Linguistica nel Rumore

Un nuovo strumento per testare i modelli linguistici in ambienti rumorosi.

2025-07-21T05:23:24+00:00 ― 4 leggere min

Apprendimento automatico Ridefinire le valutazioni dei modelli di machine learning per i dati tabulari

Un nuovo approccio per valutare i modelli di ML concentrandosi sulla preparazione dei dati.

2025-07-20T15:49:42+00:00 ― 8 leggere min

Apprendimento automatico Valutare i Metodi di AI Spiegabile per l'Affidabilità

La ricerca valuta la stabilità dei metodi XAI usando un dataset sul diabete.

2025-07-20T07:08:18+00:00 ― 6 leggere min

Ingegneria del software Valutare i grandi modelli di linguaggio nei contesti di programmazione

Uno studio su come i LLM gestiscono le regole e i vincoli di programmazione.

2025-07-19T18:29:54+00:00 ― 4 leggere min

Calcolo e linguaggio Valutare i Grandi Modelli Linguistici: Spunti Chiave

Scopri l'importanza e le sfide di valutare efficacemente le prestazioni degli LLM.

2025-07-19T12:26:30+00:00 ― 5 leggere min

Ingegneria del software Valutare i modelli di base: sfide e soluzioni

Uno sguardo alle classifiche dei modelli di fondazione e ai problemi di valutazione.

2025-07-19T12:10:42+00:00 ― 7 leggere min

Apprendimento automatico Rivalutare i modelli generativi con nuove metriche

Nuove metriche offrono una valutazione migliore delle prestazioni dei modelli generativi nel machine learning.

2025-07-19T03:21:24+00:00 ― 5 leggere min

Apprendimento automatico Capire l'effetto Rashomon nel machine learning

L'effetto Rashomon svela diversi modelli efficaci nel machine learning.

2025-07-18T20:46:24+00:00 ― 8 leggere min

Metodologia Valutare i risultati di tempo fino all'evento: una recensione critica

Una recensione dei metodi per valutare le previsioni di tempo fino all'evento nella scienza dei dati.

2025-07-18T17:22:28+00:00 ― 7 leggere min

Apprendimento automatico Il Ruolo dell'Invarianza nell'Apprendimento per Trasferimento

Esaminare come l'invarianza influisce sulle prestazioni del modello nel transfer learning.

2025-07-18T11:33:24+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'impatto del post-addestramento sui modelli linguistici

Analizzare i veri effetti dei metodi post-allenamento sulle prestazioni dei modelli linguistici.

2025-07-18T04:50:30+00:00 ― 5 leggere min

Apprendimento automatico Sfide nei modelli di classificazione a una classe leggeri

Esaminare le vulnerabilità dei modelli leggeri contro gli attacchi avversari.

2025-07-17T15:24:42+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Affrontare l’allucinazione degli oggetti nei modelli visione-linguaggio

Questo studio valuta quanto bene i modelli grandi gestiscono più oggetti nelle immagini.

2025-07-17T12:30:54+00:00 ― 6 leggere min

Apprendimento automatico Valutare i progressi nell'adattamento al dominio di grafi non supervisionati

Uno sguardo alle sfide e alle innovazioni nei metodi di adattamento del dominio grafico.

2025-07-16T23:13:00+00:00 ― 8 leggere min

Apprendimento automatico Migliorare l'affidabilità del modello attraverso l'analisi della calibrazione

Questa ricerca migliora l'affidabilità dei modelli di machine learning tramite tecniche di calibrazione e ricalibrazione.

2025-07-16T19:28:48+00:00 ― 9 leggere min

Apprendimento automatico Sfide nell'elaborazione di lunghe sequenze di dati

Esaminando le difficoltà che i modelli affrontano con le sequenze lunghe in varie applicazioni.

2025-07-16T04:15:24+00:00 ― 5 leggere min

Apprendimento automatico Gestire il random nelle reti neurali profonde

Scopri come la scelta casuale del seme influisce sulle prestazioni e l'affidabilità del modello AI.

2025-07-15T19:16:52+00:00 ― 6 leggere min

Calcolo e linguaggio Ripensare i Metodi di Valutazione per LLMs

Un modo nuovo per valutare i modelli linguistici grandi per avere migliori intuizioni sulle performance.

2025-07-15T16:32:18+00:00 ― 5 leggere min

Apprendimento automatico HO-FMN: Un Nuovo Approccio agli Attacchi Avversari

Introducendo HO-FMN per una migliore valutazione della robustezza dei modelli di machine learning contro attacchi avversari.

2025-07-15T08:54:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rivalutare le vulnerabilità nei modelli di segmentazione semantica

Esaminare gli attacchi avversari e la robustezza del modello nella segmentazione semantica.

2025-07-14T09:27:54+00:00 ― 6 leggere min

Apprendimento automatico Nuovo quadro per spiegare le decisioni dell'IA

Presentiamo PACE, un approccio strutturato per spiegazioni affidabili dell'IA.

2025-07-13T03:51:48+00:00 ― 5 leggere min

Apprendimento automatico Pratiche discutibili nella valutazione del machine learning

Una panoramica delle pratiche che minano la fiducia nelle valutazioni dei modelli di machine learning.

2025-07-12T19:16:54+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare modelli multimodali sul benchmark VALSE

Questo articolo esamina l'efficacia dei modelli multimodali che usano dati linguistici e visivi.

2025-07-11T16:17:24+00:00 ― 8 leggere min

Apprendimento automatico Un Nuovo Approccio alla Valutazione delle Caratteristiche nei Modelli di AI

Presentiamo GOAR, un metodo per capire meglio l'importanza delle caratteristiche nell'IA.

2025-07-11T13:23:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Affrontare la miscalibrazione nei modelli visione-lingua

Questo articolo affronta i problemi di miscalibrazione nei modelli visione-lingua e propone soluzioni.

2025-07-11T01:08:54+00:00 ― 5 leggere min

Suono Valutare il ragionamento nei modelli audio-linguistici

Questo studio valuta le capacità di ragionamento dei modelli audio-linguistici con un nuovo compito.

2025-07-10T09:54:05+00:00 ― 8 leggere min

Apprendimento automatico Valutare i Metodi di Adattamento al Test nel Machine Learning

Uno studio su come migliorare i metodi TTA per le variazioni dei dati nel mondo reale.

2025-07-10T06:03:24+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Valutare modelli multimodali con MIBench

MIBench testa le performance dei modelli multimodali su più immagini.

2025-07-09T14:23:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il riconoscimento OOD con modelli visione-lingua

Progressi nel rilevamento di dati fuori distribuzione usando nuove tecniche.

2025-07-08T10:44:18+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare modelli di linguaggio a lungo termine con ICL a vita

Un nuovo metodo per valutare le abilità di apprendimento dei modelli linguistici a lungo contesto tramite Task Haystack.

2025-07-08T10:20:36+00:00 ― 8 leggere min

Apprendimento automatico Valutare le prestazioni del modello su compiti diversi

Questo articolo analizza le performance del modello attraverso vari compiti e dataset.

2025-07-08T02:42:24+00:00 ― 5 leggere min

Teoria della statistica Valutare i modelli di Machine Learning: Cross-Validation vs. Approccio Plug-In

Uno sguardo ai metodi di valutazione dei modelli e alla loro efficacia.

2025-07-06T20:49:44+00:00 ― 6 leggere min

Apprendimento automatico Sfide nel Deep Learning Bayesiano: Il Buco dell'Incertezza Epistemica

Esplorare i problemi dell'incertezza epistemica nei metodi di Deep Learning Bayesiano.

2025-07-06T09:08:48+00:00 ― 5 leggere min

Intelligenza artificiale Valutare i Grandi Modelli Linguistici: Un Approccio Completo

Esplora diversi framework e metodi per valutare i modelli di linguaggio di grandi dimensioni in modo efficace.

2025-07-06T02:07:18+00:00 ― 7 leggere min

Calcolo e linguaggio Ottimizzare la valutazione dei modelli linguistici con Metabench

Un nuovo framework di benchmarking migliora l'efficienza nella valutazione dei modelli di linguaggio.

2025-07-05T16:27:28+00:00 ― 6 leggere min