Articoli più recenti per Valutazione

Calcolo e linguaggio Presentiamo SciEval: un nuovo standard per il test degli LLM nella scienza

SciEval valuta i modelli linguistici sulle loro abilità nella ricerca scientifica attraverso domande diverse.

2025-10-05T01:01:24+00:00 ― 6 leggere min

Interazione uomo-macchina Valutare i Sistemi di Guida nell'Analisi Visiva

Un approccio pratico per valutare i sistemi di guida per un'analisi dei dati efficace.

2025-10-04T23:02:54+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la classificazione dei documenti per le applicazioni nel mondo reale

Quest'articolo parla della necessità di tecniche migliori per la classificazione dei documenti.

2025-10-04T21:43:54+00:00 ― 6 leggere min

Ottimizzazione e controllo Sistemi di frenata ad aria avanzati con tecnologia AI

Combinare le reti neurali con i metodi tradizionali migliora la sicurezza e le prestazioni del freno ad aria.

2025-10-04T20:23:40+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare la Traduzione Automatica: Metriche per Frasi vs. Metriche per Paragrafi

Questo articolo esamina quanto bene i metodi di valutazione attuali valutano le traduzioni a livello di paragrafo.

2025-10-04T14:29:24+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i modelli di linguaggio in sanità: un nuovo dataset

Un nuovo set di dati aiuta a valutare i modelli linguistici per le applicazioni sanitarie.

2025-10-03T22:25:36+00:00 ― 7 leggere min

Suono Progressi nel miglioramento del parlato con reti neurali a impulsi

Un nuovo metodo per migliorare la qualità del discorso usando reti a basso consumo energetico.

2025-10-03T21:44:15+00:00 ― 5 leggere min

Calcolo e linguaggio Un nuovo dataset per la generazione di conoscenza conversazionale

Presentiamo un dataset incentrato su conversazioni di domande e risposte fattuali.

2025-10-03T00:26:18+00:00 ― 5 leggere min

Epidemiologia Valutare i sistemi di sorveglianza One Health in Europa

Uno studio valuta l'efficacia della sorveglianza One Health in undici sistemi europei.

2025-10-02T14:44:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Valutare proposte di oggetti in compiti di visione-linguaggio

Un nuovo metodo per valutare meglio le proposte di oggetti nei compiti di visione e linguaggio.

2025-10-02T04:25:30+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei sistemi di valutazione dei dialoghi multilingue

I ricercatori usano la traduzione automatica per migliorare le valutazioni della qualità del dialogo in diverse lingue.

2025-10-02T01:08:00+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare le allucinazioni nei modelli linguistici di grandi dimensioni

Questo articolo esamina le allucinazioni nei modelli linguistici AI e la ricerca in corso.

2025-10-01T04:19:48+00:00 ― 7 leggere min

Basi di dati Sfide nell'Ottimizzazione delle Query Apprese

Esaminando problemi e soluzioni per ottimizzatori di query appresi nella gestione dei database.

2025-10-01T01:26:00+00:00 ― 5 leggere min

Calcolo e linguaggio Nuovo Dataset HAE-RAE Valuta i Modelli di Linguaggio Coreani

HAE-RAE Bench si concentra sulla valutazione della conoscenza culturale nei modelli linguistici coreani.

2025-09-30T02:31:24+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare il ragionamento nei modelli visione-linguaggio

Questo lavoro valuta quanto bene i VLM ragionano basandosi sui contenuti visivi.

2025-09-29T06:14:48+00:00 ― 7 leggere min

Calcolo e linguaggio Creare Domande di Follow-up Efficaci

Uno studio su come generare domande di follow-up significative per approfondire la comprensione.

2025-09-28T14:03:06+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando la sintesi vocale espressiva con un nuovo dataset

Un nuovo dataset migliora la sintesi vocale catturando l'espressione emotiva senza fare affidamento sul testo.

2025-09-27T18:22:05+00:00 ― 6 leggere min

Interazione uomo-macchina Un Nuovo Modello per Comprendere le Emozioni

Un modello che integra la valutazione e l'apprendimento per rinforzo migliora la valutazione emotiva.

2025-09-27T18:10:12+00:00 ― 5 leggere min

Calcolo e linguaggio Classificare le Revisioni nei Saggi Argomentativi

Questo studio esamina come classificare le revisioni per migliorare la scrittura argomentativa.

2025-09-27T09:44:36+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i modelli linguistici in diverse lingue

Esplorare come i LLM possano valutare i risultati dei modelli in più lingue.

2025-09-27T00:00:00+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare la qualità della traduzione con la valutazione contestuale

SLIDE migliora le valutazioni della traduzione automatica incorporando un contesto più ampio durante la valutazione.

2025-09-26T15:10:42+00:00 ― 6 leggere min

Robotica Nuovo metodo per la navigazione dei robot mobili

Questo metodo migliora la pianificazione del percorso dei robot mobili in ambienti che cambiano.

2025-09-26T02:56:00+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare il Rispondere a Domande Lunghe nei Modelli Linguistici

Questo studio confronta le prestazioni di diversi modelli linguistici nel rispondere a domande complesse.

2025-09-26T02:24:24+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutazione di un sistema di mascheramento del suono automatico nei parchi urbani

Uno studio esamina l'efficacia dei mascheratori di suono automatici negli spazi pubblici.

2025-09-25T18:35:40+00:00 ― 5 leggere min

Ingegneria del software Fuzzing Mirato: Test del Software Mirato per Scoprire Bug

Un approccio mirato per identificare velocemente i bug software tramite test specifici.

2025-09-25T00:36:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la diagnosi del cancro con segnali di causalità nelle immagini mediche

Un nuovo metodo migliora la diagnosi del cancro integrando segnali di causalità deboli nelle immagini mediche.

2025-09-24T21:02:42+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nel trasferimento di stile di testi complessi

Nuovi metodi migliorano il trasferimento di stile per il testo mantenendo il significato.

2025-09-24T17:53:06+00:00 ― 7 leggere min

Calcolo e linguaggio Affrontare l'odio nel dialetto algerino

Uno studio sulla rilevazione del linguaggio d'odio nei social media algerini.

2025-09-24T05:22:36+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare i chatbot per la salute: metriche per il successo

Questo articolo parla delle metriche di valutazione per chatbot sanitari efficaci.

2025-09-23T19:53:48+00:00 ― 6 leggere min

Intelligenza artificiale Evolvere modelli di Deep Learning con evoluzione regolarizzata

Questo studio esamina come i modelli di deep learning cambiano durante la Ricerca dell'Architettura Neurale.

2025-09-23T17:07:54+00:00 ― 7 leggere min

Logica nell'informatica Migliorare la Valutazione delle Espressioni nel Calcolo Lambda

Scopri un nuovo modo per migliorare l'efficienza di valutazione nel calcolo lambda.

2025-09-23T16:28:24+00:00 ― 7 leggere min

Apprendimento automatico SALSA-CLRS: Un Nuovo Riferimento per gli Algoritmi

Presentiamo SALSA-CLRS per migliorare la valutazione degli algoritmi usando grafi sparsi.

2025-09-23T14:06:12+00:00 ― 6 leggere min

Calcolo e linguaggio Un nuovo modo per valutare i sistemi di risposta alle domande

Il metric SQuArE migliora la valutazione dei sistemi QA attraverso riferimenti a più risposte.

2025-09-23T13:58:18+00:00 ― 5 leggere min

Apprendimento automatico Migliorare la salute online con la classificazione automatica

Un nuovo sistema punta a collegare gli utenti con i professionisti della salute tramite classificazione automatizzata.

2025-09-21T11:16:48+00:00 ― 5 leggere min

Calcolo e linguaggio Il Futuro della Telemedicina: Riassumere le Interazioni con i Pazienti

I progressi nel riassumere le conversazioni tra dottori e pazienti migliorano la comunicazione nella telemedicina.

2025-09-21T04:18:06+00:00 ― 8 leggere min

Linguaggi di programmazione Dimostrare l'affidabilità nel calcolo lambda tipizzato semplicemente

Esplorando tecniche di prova per valutare funzioni nei linguaggi di programmazione.

2025-09-21T03:46:30+00:00 ― 6 leggere min

Strutture dati e algoritmi L'importanza della stabilità delle preferenze individuali nel clustering

La stabilità nel clustering fa sì che i gruppi siano efficaci e significativi.

2025-09-20T18:01:54+00:00 ― 6 leggere min

Apprendimento automatico Presentiamo GRANDE: Un Nuovo Metodo per Dati Tabulari

GRANDE usa la discesa del gradiente per migliorare l'apprendimento dai dati tabulari.

2025-09-20T08:17:18+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare i modelli di intelligenza artificiale con meta caratteristiche

Un nuovo metodo per valutare i modelli di intelligenza artificiale attraverso embedding e meta caratteristiche.

2025-09-19T10:10:06+00:00 ― 7 leggere min

Calcolo e linguaggio Analisi automatizzata dei testi legali

Un nuovo metodo rivela schemi nelle decisioni legali utilizzando l'analisi automatizzata dei testi.

2025-09-19T06:21:00+00:00 ― 8 leggere min