Articoli più recenti per Valutazione del modello

Apprendimento automatico Benchmarking la somiglianza rappresentazionale nelle reti neurali

Un nuovo benchmark valuta i metodi per misurare la somiglianza rappresentativa nel machine learning.

2025-07-03T18:17:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'affidabilità del modello con DECIDER

Un nuovo modo per rilevare i guasti nei modelli di classificazione delle immagini.

2025-07-03T14:20:42+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare modelli linguistici nella generazione di output strutturato

Valutare quanto bene i LLM producono output JSON tramite i test StructuredRAG.

2025-07-01T07:34:18+00:00 ― 6 leggere min

Apprendimento automatico Navigare tra le sfide dell'adattamento di dominio non supervisionato

Uno studio su come migliorare i metodi UDA tramite la valutazione e la comprensione dei cambiamenti nei dati.

2025-06-29T22:46:28+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la fusione dei modelli con ProFuser

Un nuovo metodo per combinare i modelli linguistici in modo più efficace.

2025-06-29T22:23:30+00:00 ― 6 leggere min

Apprendimento automatico Migliorare la fiducia con AOPC normalizzato nelle reti neurali

Un nuovo approccio aumenta la comprensione delle previsioni del modello attraverso l'attribuzione delle caratteristiche.

2025-06-27T09:25:48+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuove intuizioni sulla valutazione dei modelli visivi

Un nuovo metodo svela come i modelli visivi organizzano e comprendono le immagini.

2025-06-27T03:22:24+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'attribuzione nei modelli di linguaggio autoregressivi

Nuova tecnica per capire meglio le previsioni dei modelli usando esempi controfattuali.

2025-06-25T10:01:48+00:00 ― 6 leggere min

Apprendimento automatico Migliorare le Previsioni delle Serie Temporali con VMD e Modelli Lineari

Un metodo che combina VMD e modelli lineari aumenta la precisione della previsione.

2025-06-23T03:19:25+00:00 ― 5 leggere min

Calcolo e linguaggio Un nuovo framework per valutare i modelli linguistici

Il framework PoEM valuta i modelli linguistici senza avere bisogno di etichette precise.

2025-06-22T10:32:06+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare la stabilità dei modelli linguistici tramite variazioni di input

Questo studio valuta come piccoli cambiamenti influiscono sulle risposte dei modelli di linguaggio.

2025-06-22T09:42:00+00:00 ― 4 leggere min

Calcolo e linguaggio Rilevare la contaminazione nei modelli di linguaggio grandi

Un nuovo metodo aiuta a identificare la contaminazione dei dati di test negli LLM usando le probabilità dei token.

2025-06-22T01:19:06+00:00 ― 9 leggere min

Apprendimento automatico Una nuova misura per valutare i metodi di selezione delle caratteristiche

FSDEM offre un nuovo modo di valutare le tecniche di selezione delle feature per l'analisi dei dati.

2025-06-21T23:12:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Analizzando MAPWise: Un Nuovo Dataset per Modelli Vision-Language

Il dataset MAPWise sfida i modelli con domande basate su mappe e valuta le loro capacità di ragionamento.

2025-06-19T21:42:18+00:00 ― 7 leggere min

Calcolo e linguaggio Un nuovo sistema di valutazione per i modelli linguistici

Questo articolo parla di un nuovo sistema di valutazione per giudicare i modelli linguistici in modo più equo.

2025-06-18T21:36:36+00:00 ― 6 leggere min

Apprendimento automatico Logit Scaling: Un Nuovo Approccio per il Rilevamento OOD

La scalatura logit migliora il rilevamento dei dati fuori distribuzione senza dati di addestramento.

2025-06-18T10:17:12+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Confronto dei modelli per il rilevamento dell'inquinamento dei fiumi

Questo studio valuta modelli di machine learning per rilevare rifiuti nei fiumi.

2025-06-16T17:44:00+00:00 ― 5 leggere min

Apprendimento automatico Valutare la Distanza Avversariale nei Classificatori di Machine Learning

Un nuovo metodo per valutare la robustezza nei classificatori ML usando la distanza avversariale.

2025-06-16T15:06:00+00:00 ― 6 leggere min

Intelligenza artificiale Valutare le vere abilità dei modelli di linguaggio

Uno sguardo più da vicino su come i modelli di linguaggio grandi svolgono compiti di base.

2025-06-13T22:50:48+00:00 ― 8 leggere min

Calcolo e linguaggio Cross-Refine: Migliorare le spiegazioni dai modelli di linguaggio

Un nuovo metodo migliora le spiegazioni dell'IA grazie alla collaborazione tra due modelli linguistici.

2025-06-13T13:29:54+00:00 ― 6 leggere min

Apprendimento automatico Valutare gli Autoencoder Variationali attraverso il Grado Topologico

Questa ricerca esplora come il grado topologico valuta l'efficacia dei VAE nel catturare la struttura dei dati.

2025-06-13T08:55:11+00:00 ― 5 leggere min

Calcolo e linguaggio Bilanciare la conoscenza locale e globale nei LLMs

Uno studio svela come i modelli di linguaggio usano il contesto per risposte precise.

2025-06-13T08:06:00+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Affrontare il Cambiamento di Distribuzione nel Machine Learning

Nuovi metodi aiutano a capire come i modelli reagiscono ai cambiamenti nei dati.

2025-06-13T00:12:00+00:00 ― 7 leggere min

Calcolo e linguaggio Sfide nel rilevare la contaminazione dei dati nei LLM

Questo articolo esamina i metodi per rilevare la contaminazione dei dati nei modelli linguistici di grandi dimensioni.

2025-06-11T22:39:24+00:00 ― 6 leggere min

Apprendimento automatico Aumentare la stabilità in SGD con tecniche di Bootstrap

Questo documento esplora come i metodi bootstrap migliorano la stabilità e la robustezza nei modelli SGD.

2025-06-11T04:10:28+00:00 ― 5 leggere min

Apprendimento automatico Misurare l'incertezza nei modelli di linguaggio

Un nuovo benchmark mira a migliorare la valutazione dell'incertezza nei modelli linguistici.

2025-06-11T02:30:42+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare le spiegazioni del Machine Learning con il prompting dei tracciati di programma

Un nuovo metodo migliora il ragionamento del modello attraverso tracce di programmazione strutturata.

2025-06-11T00:16:24+00:00 ― 8 leggere min

Calcolo e linguaggio Valutare la sicurezza nei modelli linguistici affilati

Esaminando come il fine-tuning influisce sulla sicurezza nei modelli linguistici in vari compiti.

2025-06-10T08:04:42+00:00 ― 6 leggere min

Apprendimento automatico Migliorare la Valutazione dei Modelli di Machine Learning con la Teoria della Risposta agli Item

Un nuovo modo di valutare i modelli di ML usando la Teoria della Risposta all'Elemento per avere intuizioni migliori.

2025-06-10T02:18:24+00:00 ― 6 leggere min

Apprendimento automatico Il Ruolo dei Forti Modelli di Base nell'ML in Sanità

Modelli di base solidi migliorano la valutazione dei sistemi ML nella sanità.

2025-06-10T01:53:24+00:00 ― 6 leggere min

Apprendimento automatico Rivalutare gli Intervalli di Confidenza nel Few-Shot Learning

Uno sguardo agli intervalli di confidenza nel few-shot learning e il loro impatto sulla valutazione del modello.

2025-06-09T22:58:08+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare la veridicità nei modelli di linguaggio

Esaminando la comprensione e l'accuratezza dei risultati dei modelli linguistici.

2025-06-09T04:02:00+00:00 ― 5 leggere min

Apprendimento automatico Migliorare le Reti Neurali Informate dalla Fisica con le Funzioni di Influenza

Ricerca che mette in evidenza l'uso delle funzioni d'influenza per migliorare le prestazioni delle PINN nei problemi fisici.

2025-06-08T18:12:45+00:00 ― 6 leggere min

Apprendimento automatico Capire la complessità dei modelli nel machine learning

Uno sguardo su come la dimensione efficace influisce sull'addestramento dei modelli.

2025-06-08T09:25:08+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'affidabilità dei modelli linguistici nella scienza

Questo documento valuta quanto bene i modelli linguistici spiegano i concetti scientifici.

2025-06-08T07:37:30+00:00 ― 5 leggere min

Apprendimento automatico Bilanciare Prestazioni e Interpretabilità con i GAM

Questo articolo esamina i GAM come soluzione per le performance predittive e l'interpretabilità.

2025-06-08T01:18:18+00:00 ― 7 leggere min

Apprendimento automatico Rivisitare l'accuratezza dei test in AutoML: il ruolo dei casi difficili

Esaminando come i campioni difficili influenzano le prestazioni del modello e l'affidabilità dell'accuratezza del test.

2025-06-08T00:30:54+00:00 ― 9 leggere min

Calcolo e linguaggio Importanza dei Layer nei Modelli di Linguaggio Grandi

Questo articolo esamina come i diversi strati influenzano le prestazioni degli LLM.

2025-06-08T00:07:12+00:00 ― 5 leggere min

Apprendimento automatico L'impatto dell'apprendimento con etichette morbide nei modelli di classificazione

Le etichette morbide possono migliorare le performance dei modelli di machine learning in situazioni di dati incerti.

2025-06-06T18:21:48+00:00 ― 6 leggere min

Ingegneria del software Presentiamo RepairBench: un nuovo standard per la valutazione della riparazione dei programmi AI

RepairBench stabilisce standard per confrontare modelli di intelligenza artificiale nella risoluzione di bug software.

2025-06-04T10:00:36+00:00 ― 6 leggere min