Articoli più recenti per Valutazione

Apprendimento automatico Migliorare l'ottimizzazione ad alta dimensione con il miglioramento atteso delle coordinate

Un nuovo metodo migliora l'ottimizzazione in problemi costosi ad alta dimensione.

2025-08-09T10:04:04+00:00 ― 6 leggere min

Intelligenza artificiale Valutare i modelli linguistici con il framework ALI-Agent

Un nuovo metodo per valutare quanto i modelli linguistici siano in linea con i valori umani.

2025-08-09T06:16:24+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Tecniche innovative per unire i prompt di testo nella generazione di immagini

Un nuovo metodo migliora la creazione di immagini da più testo.

2025-08-08T22:14:30+00:00 ― 6 leggere min

Economia generale Il Bilanciamento tra Competizione e Collaborazione nel Crowdsourcing

Un'overview dei comportamenti nelle comunità di crowdsourcing e dei loro impatti.

2025-08-08T20:43:00+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare i Sistemi di Dialogo attraverso la Consapevolezza della Storia della Conversazione

Questa ricerca evidenzia la necessità di una valutazione migliore dell'uso della cronologia delle conversazioni nei sistemi di dialogo.

2025-08-08T14:28:24+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare la NLG con il framework AdvEval

AdvEval mette in luce le debolezze nelle metriche di valutazione della Generazione del Linguaggio Naturale.

2025-08-08T07:29:42+00:00 ― 7 leggere min

Calcolo e linguaggio Uno Strumento per Trasformare Figure Scientifiche

Nuovo strumento trasforma schizzi in grafica chiara per i ricercatori.

2025-08-07T11:28:54+00:00 ― 7 leggere min

Intelligenza artificiale Introducendo la Prova di Qualità per AI Generativa Decentralizzata

Un nuovo metodo aumenta l'affidabilità delle uscite dell'IA negli ambienti blockchain.

2025-08-05T14:19:12+00:00 ― 10 leggere min

Visione artificiale e riconoscimento di modelli NTIRE 2024 Challenge: Ripristino delle Immagini nel Mondo Reale

I partecipanti si cimentano nel ripristino di immagini degradate in un contesto competitivo.

2025-08-05T11:49:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per il tracciamento di scene 3D dai video

Un nuovo sistema tiene traccia e riconosce scene 3D dinamiche usando un singolo video.

2025-08-05T06:33:06+00:00 ― 6 leggere min

Intelligenza artificiale Segmentazione delle Frasi Musicali Usando Algoritmi

Valutare algoritmi per una segmentazione efficace delle frasi musicali e analisi della struttura.

2025-08-04T22:31:12+00:00 ― 5 leggere min

Logica nell'informatica Ripensare la valutazione dell'intelligenza: un focus sulla credibilità

Un nuovo metodo migliora il modo in cui i messaggi di intelligence vengono valutati dando priorità alla credibilità.

2025-08-04T15:48:18+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nella Valutazione dei Modelli di Lingua Coreana

Nuove risorse migliorano la valutazione dei modelli di lingua coreana.

2025-08-04T10:48:06+00:00 ― 5 leggere min

Informatica neurale ed evolutiva Nuovo Framework per la Generazione di Algoritmi Usando LLMs

Quest'articolo esamina un nuovo modo per creare algoritmi con i LLM.

2025-08-04T07:14:48+00:00 ― 5 leggere min

Intelligenza artificiale Un nuovo approccio alla presa di decisioni con la logica a sette valori

Scopri come la logica a sette valori migliora il processo decisionale con più criteri.

2025-08-04T05:00:30+00:00 ― 6 leggere min

Elaborazione di immagini e video 2023 AAPM Grand Challenge su Imaging Medico

Una sfida che si concentra su modelli generativi profondi per la generazione di immagini mediche realistiche.

2025-08-04T00:01:12+00:00 ― 9 leggere min

Calcolo e linguaggio Nuovo modello valuta la leggibilità degli articoli di Wikipedia in più lingue

Un modello valuta la leggibilità degli articoli di Wikipedia in 14 lingue.

2025-08-03T06:53:18+00:00 ― 7 leggere min

Calcolo e linguaggio Automatizzare la generazione di distrattori nella comprensione del testo

Un nuovo approccio che usa LLM per creare distrattori con il minimo input umano.

2025-08-03T00:57:48+00:00 ― 4 leggere min

Intelligenza artificiale Valutare il favoritismo nei metriche dell'IA generativa

Un nuovo modo per valutare i pregiudizi nei metriche di valutazione automatica dell'AI.

2025-08-02T22:04:00+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare il ragionamento nei modelli di linguaggio

Nuovi metodi mirano a migliorare le capacità di ragionamento nei modelli di linguaggio.

2025-08-02T09:25:36+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i modelli di linguaggio e la loro comprensione del mondo

Nuove metriche mettono in luce le limitazioni dei modelli linguistici nel rappresentare la realtà.

2025-08-02T05:12:48+00:00 ― 7 leggere min

Apprendimento automatico Benchmark dinamici per valutare i modelli di linguaggio

Un nuovo sistema per valutare i modelli linguistici usando flussi di dati reali.

2025-08-02T01:23:42+00:00 ― 6 leggere min

Calcolo e linguaggio IrokoBench: Un Nuovo Benchmark per le Lingue Africane

Presentiamo IrokoBench per migliorare la valutazione dei LLM nelle lingue africane.

2025-08-02T00:44:12+00:00 ― 7 leggere min

Elaborazione di immagini e video Avanzamenti nella segmentazione dei tumori con la sfida ULS23

La sfida ULS23 punta a migliorare la segmentazione dei tumori nelle TC per una cura del cancro migliore.

2025-07-31T18:27:20+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per rilevare le immagini generate dall'IA

Un nuovo approccio migliora la rilevazione di immagini false create dall'IA.

2025-07-30T00:58:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Valutare la comprensione dei video nei modelli linguistici multimodali

Un nuovo benchmark mira a valutare gli MLLM nella comprensione dei video su più argomenti.

2025-07-29T22:20:42+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Attribuzione dell'influenza nei modelli testo-immagine

Questo studio presenta un nuovo metodo per identificare le immagini chiave di addestramento nei visual generati dall'IA.

2025-07-29T11:56:36+00:00 ― 8 leggere min

Apprendimento automatico L'ascesa dell'unlearning nel machine learning

Esplorare l'importanza dei metodi di disapprendimento nel moderno machine learning.

2025-07-29T06:16:54+00:00 ― 5 leggere min

Apprendimento automatico Migliorare gli Standard di Ricerca nel Reinforcement Learning Multi-Agent Offline

Esaminare le questioni chiave nel MARL offline e proporre soluzioni standardizzate.

2025-07-29T05:53:12+00:00 ― 6 leggere min

Informatica neurale ed evolutiva Capire la Programmazione Genetica Cartesiana: Un Approccio Flessibile

Scopri CGP, il suo funzionamento, i vantaggi, le applicazioni e le sfide nella programmazione.

2025-07-29T05:37:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella generazione di immagini e testo

Un nuovo dataset migliora la coerenza nelle sequenze immagine-testo per una creazione di contenuti efficace.

2025-07-29T01:32:30+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare i LLM con il nuovo benchmark SciEx

SciEx rivela punti di forza e sfide dei LLM nella valutazione scientifica.

2025-07-29T00:53:00+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare l'IA per le lingue del sud-est asiatico

SEACrowd punta a migliorare la rappresentanza dell'IA per le lingue e le culture del Sud-Est asiatico.

2025-07-28T21:03:54+00:00 ― 7 leggere min

Intelligenza artificiale Testing Language Models con Problemi Multipli

Uno studio valuta i modelli linguistici nel gestire più compiti contemporaneamente.

2025-07-28T14:05:12+00:00 ― 8 leggere min

Calcolo e linguaggio Valutare i Grandi Modelli di Linguaggio con Testo Strutturato

Un nuovo benchmark testa le capacità dei LLM con formati di dati strutturati.

2025-07-28T12:22:30+00:00 ― 6 leggere min

Multimedia Valutare la qualità dei corsi online con VCEval

VCEval offre un modo automatico per valutare l'efficacia dei corsi online.

2025-07-28T10:39:48+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo benchmark per modelli video-lingua

Un nuovo benchmark punta sulla composizionalità nella comprensione dei video e nei modelli linguistici.

2025-07-28T04:52:12+00:00 ― 6 leggere min

Apprendimento automatico Migliorare gli standard di valutazione dei modelli linguistici

Un nuovo metodo migliora i test per i modelli linguistici usando dati reali degli utenti.

2025-07-27T21:06:06+00:00 ― 6 leggere min

Calcolo e linguaggio Presentiamo la famiglia di modelli Nemotron-4 340B

La famiglia Nemotron-4 340B offre modelli potenti per applicazioni diverse e generazione di dati sintetici.

2025-07-27T18:43:54+00:00 ― 8 leggere min

Calcolo e linguaggio Competenza Culturale nei Modelli Linguistici: Uno Studio

Valutare come i modelli linguistici gestiscono i segnali culturali in compiti reali.

2025-07-27T16:53:18+00:00 ― 8 leggere min