Articoli più recenti per Valutazione

Ingegneria del software Migliorare il Code Review con ReviewRanker

Un nuovo sistema per migliorare il processo di revisione del codice e garantire la qualità.

2025-10-22T07:46:24+00:00 ― 6 leggere min

Apprendimento automatico Un Approccio Sostenibile alla Ricerca di Architetture Neurali

Nuovo framework bilancia efficienza del deep learning e emissioni di carbonio.

2025-10-22T01:58:48+00:00 ― 6 leggere min

Medicina legale Sfide per i bambini non accompagnati in cerca di asilo

Oltre 300.000 bambini stanno cercando asilo negli Stati Uniti, affrontando numerosi ostacoli.

2025-10-21T16:46:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato FALL-E: Una Nuova Era nella Creazione Sonora

FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.

2025-10-21T13:13:20+00:00 ― 5 leggere min

Intelligenza artificiale Sfide nell'AI Spiegabile: Un'Immersione Profonda

Esaminando i problemi e il potenziale dei metodi di intelligenza artificiale spiegabile.

2025-10-20T10:13:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Usare il linguaggio per creare scenari di traffico dinamici

Un metodo che genera scene di traffico usando il linguaggio naturale per testare auto a guida autonoma.

2025-10-19T09:27:48+00:00 ― 7 leggere min

Calcolo e linguaggio L'Ascesa dei Piccoli Modelli Linguistici

Scopri il potenziale dei piccoli modelli linguistici nella tecnologia AI.

2025-10-19T09:12:00+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la Valutazione della Tassonomia con i Modelli di Linguaggio

Un nuovo metodo per valutare tassonomie usando modelli linguistici sembra promettente.

2025-10-18T17:08:12+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare gli effetti a catena nella modifica delle conoscenze

Nuove ricerche sottolineano l'importanza degli effetti a catena nell'aggiornare i modelli di linguaggio.

2025-10-16T11:40:48+00:00 ― 9 leggere min

Sistemi multiagente Migliorare il Bilancio Partecipativo tramite il Consenso

Un nuovo metodo migliora l'equità nel bilancio partecipativo promuovendo il dialogo tra gli elettori.

2025-10-16T11:01:18+00:00 ― 6 leggere min

Comunicazione e formazione scientifica Esaminando la chiarezza del linguaggio nella revisione tra pari di eLife

Lo studio valuta la chiarezza delle frasi di revisione paritaria di eLife e suggerisce miglioramenti.

2025-10-16T05:29:36+00:00 ― 6 leggere min

Recupero delle informazioni Valutare i Sistemi di Raccomandazione: DCG vs nDCG

Uno sguardo all'efficacia delle metriche di raccomandazione nelle esperienze utente.

2025-10-15T06:11:12+00:00 ― 9 leggere min

Apprendimento automatico Valutare l'incertezza nei modelli di machine learning

Valutare la capacità dei modelli di stimare l'incertezza per migliorare le previsioni.

2025-10-15T03:22:00+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la generazione di immagini da descrizioni testuali

Un nuovo metodo migliora come le immagini si abbinano ai testi.

2025-10-14T14:00:56+00:00 ― 6 leggere min

Calcolo e linguaggio Nuovo benchmark di valutazione per modelli multimodali

Un nuovo benchmark punta a migliorare la valutazione dei Modelli di Linguaggio Multimodali di Grandi Dimensioni.

2025-10-14T06:05:30+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare le strategie di apprendimento attivo nell'NLP

Un framework per confrontare i metodi di apprendimento attivo per una migliore efficienza nella etichettatura dei dati.

2025-10-13T16:31:48+00:00 ― 6 leggere min

Calcolo e linguaggio Nuovo metodo per valutare le risposte dei modelli linguistici

Un nuovo approccio usa reti più ampie per migliorare la qualità della valutazione dei modelli linguistici.

2025-10-12T17:13:30+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare il Bias nei Dati Testuali: Il Framework Nbias

Un framework per identificare e ridurre i pregiudizi nei dati testuali per risultati più equi.

2025-10-12T14:51:18+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella generazione di dati radar per la guida automatizzata

Un nuovo metodo utilizza i GAN per creare dati radar realistici per una guida automatizzata più sicura.

2025-10-12T08:40:00+00:00 ― 5 leggere min

Crittografia e sicurezza Valutare i rilevatori di uso improprio delle Crypto-API con MASC

MASC offre un nuovo modo per testare in modo efficace i rilevatori di uso improprio delle API crittografiche.

2025-10-12T06:49:24+00:00 ― 5 leggere min

Ottimizzazione e controllo Ottimizzazione Stocastica: Affrontare l'Incertezza nelle Decisioni

Scopri come l'ottimizzazione stocastica affronta l'incertezza in vari settori.

2025-10-12T04:55:12+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare le valutazioni dei riassunti con consapevolezza della ridondanza

Una nuova metrica migliora la qualità del riassunto affrontando la ridondanza e i riferimenti multipli.

2025-10-12T04:11:24+00:00 ― 6 leggere min

Ingegneria del software Valutare i modelli di linguaggio di grandi dimensioni per il codice

Nuovi metodi migliorano la comprensione dei modelli linguistici usati per compiti di codifica.

2025-10-11T13:18:42+00:00 ― 7 leggere min

Calcolo e linguaggio Presentiamo SciGraphQA: Un Nuovo Dataset per Grafi Scientifici

SciGraphQA offre un dataset ricco per capire i grafi scientifici attraverso domande e risposte.

2025-10-11T06:20:00+00:00 ― 5 leggere min

Calcolo e linguaggio CheXOFA: Un passo verso la segnalazione automatizzata delle radiografie

CheXOFA riassume i referti delle radiografie toraciche, migliorando l'efficienza nella sanità.

2025-10-11T05:26:50+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo CLEVA: Una piattaforma di valutazione per modelli di linguaggio cinese

CLEVA offre valutazioni standardizzate per valutare efficacemente i modelli di lingua cinese.

2025-10-10T07:57:00+00:00 ― 6 leggere min

Recupero delle informazioni Tendenze nei Consigli Personalizzati di POI per i Turisti

Esaminando i progressi recenti nei sistemi di raccomandazione dei POI dal 2017 al 2022.

2025-10-09T04:25:54+00:00 ― 10 leggere min

Apprendimento automatico Presentiamo UPREVE: uno strumento per la scoperta causale

UPREVE semplifica la scoperta causale nei sistemi sociali e comportamentali per i ricercatori.

2025-10-08T18:39:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo di valutazione per la sintesi testo-immagine

Un nuovo metodo per valutare la qualità della generazione di immagini basato su descrizioni testuali.

2025-10-08T01:26:24+00:00 ― 7 leggere min

Fisica delle alte energie - Esperimento Generare immagini dai dati della fisica delle particelle usando modelli AI

Questo articolo mette in evidenza l'uso di modelli generativi per creare immagini di fisica delle particelle.

2025-10-07T19:22:00+00:00 ― 6 leggere min

Calcolo e linguaggio Presentiamo il Benchmark Medico Completo per i LLM in Cina

Un nuovo riferimento per valutare i modelli linguistici nei contesti medici cinesi.

2025-10-07T18:51:24+00:00 ― 10 leggere min

Apprendimento automatico Migliorare i metodi di attribuzione delle feature nell'IA

Valutando i metodi di attribuzione delle caratteristiche tramite solidità e completezza per previsioni AI migliori.

2025-10-07T18:35:36+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare ChatGPT per l'allineamento delle ontologie

Questo studio valuta come ChatGPT si comporta nel confrontare le ontologie.

2025-10-07T15:57:36+00:00 ― 5 leggere min

Calcolo e linguaggio Valutazione dei sistemi di correzione degli errori grammaticali

Una panoramica su come valutare efficacemente i sistemi GEC.

2025-10-07T12:40:06+00:00 ― 7 leggere min

Intelligenza artificiale Misurare la Relazione Semantica in DBpedia

Questo documento esamina metodi per valutare la relazione tra concetti usando DBpedia.

2025-10-07T02:16:00+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare i modelli linguistici attraverso l'istruzione di messa a punto

Uno sguardo a come il tuning delle istruzioni migliora le risposte dei modelli di linguaggio.

2025-10-06T12:02:48+00:00 ― 9 leggere min

Intelligenza artificiale Valutare i Knowledge Graph con KGrEaT

KGrEaT valuta la qualità e l'utilità dei grafi di conoscenza per vari compiti.

2025-10-06T01:22:54+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare i modelli linguistici per il portoghese

Un nuovo metodo migliora i modelli linguistici specificamente per il portoghese.

2025-10-05T21:10:06+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo il Biomedical Entity Linking Benchmark (BELB)

Un benchmark standardizzato per migliorare il collegamento delle entità biomediche e i confronti nella ricerca.

2025-10-05T17:28:54+00:00 ― 5 leggere min

Sistemi sanitari e miglioramento della qualità Collegare Ricerca e Cura del Paziente nei Sistemi Sanitari

Indagare sui sistemi di salute apprendente per una migliore erogazione delle cure.

2025-10-05T07:57:00+00:00 ― 6 leggere min