Articoli più recenti per Benchmark

Visione artificiale e riconoscimento di modelli Avanzare nell'apprendimento dei concetti nei modelli da testo a immagine

Un nuovo benchmark migliora la valutazione di come i modelli imparano i concetti visivi.

2025-11-03T11:24:54+00:00 ― 12 leggere min

Intelligenza artificiale Migliorare i benchmark di completamento dei Knowledge Graph

Un nuovo metodo migliora la valutazione per i modelli di completamento del Knowledge Graph.

2025-11-03T07:59:30+00:00 ― 9 leggere min

Basi di dati Presentiamo ScienceBenchmark: un nuovo standard per i sistemi NL-to-SQL

ScienceBenchmark offre un nuovo punto di riferimento per database scientifici complessi.

2025-11-03T06:16:48+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare la resilienza dei grandi modelli linguistici

Questo articolo parla di un benchmark per valutare i LLM rispetto a richieste complicate.

2025-11-02T21:27:30+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli GeneCIS: Migliorare la Somiglianza Condizionale delle Immagini nella Visione Artificiale

Un benchmark per valutare la somiglianza delle immagini in base a condizioni definite dall'utente.

2025-10-31T19:09:42+00:00 ― 6 leggere min

Apprendimento automatico Progressi nella ricerca sull'AI di NetHack

Nuova libreria migliora l'addestramento e la valutazione dell'AI in NetHack.

2025-10-31T09:01:24+00:00 ― 8 leggere min

Neuroscienze Neuroptimus: Ottimizzazione dei modelli neurali avanzata

Nuovo software semplifica l'ottimizzazione dei parametri per modelli neurali, aumentando l'efficienza della ricerca.

2025-10-31T00:41:20+00:00 ― 7 leggere min

Apprendimento automatico Affrontare le etichette rumorose nel Federated Learning

Un nuovo benchmark chiamato FedNoisy aiuta a gestire le etichette rumorose nell'apprendimento federato.

2025-10-29T04:53:00+00:00 ― 8 leggere min

Robotica Avanzamenti nello Sviluppo di Robot Domestici

Nuovi parametri migliorano la capacità dei robot di aiutare nei lavori di casa.

2025-10-29T04:21:24+00:00 ― 6 leggere min

Apprendimento automatico FLGo: Semplificare la ricerca sul Federated Learning

La piattaforma FLGo semplifica l'apprendimento federato per i ricercatori con strumenti flessibili.

2025-10-28T09:08:00+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare i modelli di risposta alle domande sulle tabelle

Nuovi metodi puntano a migliorare la solidità dei sistemi di risposta a domande su tabelle.

2025-10-27T10:13:24+00:00 ― 6 leggere min

Calcolo e linguaggio Nuovo strumento misura il pregiudizio contro le persone LGBTQ+ nei modelli di linguaggio

Quest'articolo esplora uno strumento di riferimento per valutare i bias nei modelli di linguaggio.

2025-10-27T04:02:06+00:00 ― 5 leggere min

Fisica delle alte energie - Esperimento HEPScore: Un Nuovo Standard per il Calcolo in Fisica delle Particelle

HEPScore punta a migliorare la valutazione delle prestazioni informatiche nella ricerca in fisica delle particelle.

2025-10-26T15:08:03+00:00 ― 5 leggere min

Robotica Valutare le Tecniche di Rimozione dei Punti Dinamici nella Robotica

Un framework di riferimento per valutare i metodi di rimozione dei punti dinamici per i robot.

2025-10-19T20:31:24+00:00 ― 6 leggere min

Software matematico MindOpt Tuner: Automatizzare la Sintonizzazione degli Iperparametri

MindOpt Tuner ottimizza le prestazioni del software numerico automatizzando le regolazioni degli iperparametri.

2025-10-19T11:34:12+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Quantizzazione a Precisione Mista per un Deep Learning Efficiente

Un metodo per migliorare l'efficienza del deep learning su dispositivi limitati.

2025-10-18T07:15:42+00:00 ― 7 leggere min

Architettura di rete e Internet Stabilire Standard per i Metodi di Controllo della Congestione

Questo lavoro propone linee guida per misurare efficacemente le prestazioni del controllo della congestione.

2025-10-18T02:39:12+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare gli effetti a catena nella modifica delle conoscenze

Nuove ricerche sottolineano l'importanza degli effetti a catena nell'aggiornare i modelli di linguaggio.

2025-10-16T11:40:48+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli Colmare il divario tra schizzi e foto

Un nuovo metodo aiuta i computer a collegare schizzi a immagini reali in modo efficace.

2025-10-16T11:25:00+00:00 ― 6 leggere min

Apprendimento automatico Valutare l'incertezza nei modelli di machine learning

Valutare la capacità dei modelli di stimare l'incertezza per migliorare le previsioni.

2025-10-15T03:22:00+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Rafforzare il riconoscimento delle nuvole di punti contro attacchi

Nuovi metodi per proteggere i sistemi di riconoscimento 3D da esempi avversari.

2025-10-14T08:27:42+00:00 ― 6 leggere min

Apprendimento automatico Capire i comportamenti nei modelli generativi

Uno sguardo più da vicino su come si comportano i modelli generativi e cosa significa per la ricerca.

2025-10-14T01:36:54+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella tecnologia di riconoscimento delle immagini

LISA migliora la comprensione delle istruzioni utente complesse da parte delle macchine.

2025-10-13T17:42:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Tecniche Avanzate di Abbinamento Immagine-Testo a Terra

Nuove ricerche migliorano l'abbinamento tra immagini e testo affrontando le relazioni non corrispondenti.

2025-10-13T03:37:36+00:00 ― 9 leggere min

Calcolo e linguaggio Nuovo metodo per valutare le risposte dei modelli linguistici

Un nuovo approccio usa reti più ampie per migliorare la qualità della valutazione dei modelli linguistici.

2025-10-12T17:13:30+00:00 ― 6 leggere min

Calcolo e linguaggio Il Ruolo dei Dati Sintetici nell'Addestramento dell'AI

Esaminare l'impatto dei dati sintetici sulle prestazioni e sull'apprendimento dei modelli di IA.

2025-10-11T18:11:00+00:00 ― 6 leggere min

Basi di dati L'AI generativa punta a trasformare le ricerche nei Data Union

Nuovi parametri di riferimento usando l'AI generativa migliorano le tecniche di combinazione delle tabelle dei dati.

2025-10-11T13:34:30+00:00 ― 7 leggere min

Apprendimento automatico Avanzare l'Apprendimento per Rinforzo Offline in StarCraft II

Un nuovo benchmark per l'RL offline migliora le strategie in StarCraft II.

2025-10-11T09:13:48+00:00 ― 6 leggere min

Ingegneria del software Avanzare con il Penetration Testing grazie all'assistenza dell'AI

Gli strumenti automatizzati migliorano il penetration testing grazie all'integrazione dell'IA e alla gestione delle attività.

2025-10-09T08:46:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzando il ragionamento spaziale nei modelli di visione e linguaggio

Nuovi metodi migliorano il modo in cui le macchine valutano le relazioni spaziali all'interno delle immagini.

2025-10-07T09:38:24+00:00 ― 6 leggere min

Fisica quantistica Computazione quantistica per la programmazione delle immagini satellitari

Questo studio esplora le tecniche di calcolo quantistico per migliorare la programmazione dell'acquisizione di immagini satellitari.

2025-10-07T03:00:45+00:00 ― 6 leggere min

Informatica distribuita, parallela e in cluster Memoria CXL: Un Nuovo Approccio nell'HPC

Indagare sul ruolo della memoria CXL nel migliorare i sistemi di calcolo ad alte prestazioni.

2025-10-06T04:48:18+00:00 ― 9 leggere min

Calcolo e linguaggio Presentiamo il Biomedical Entity Linking Benchmark (BELB)

Un benchmark standardizzato per migliorare il collegamento delle entità biomediche e i confronti nella ricerca.

2025-10-05T17:28:54+00:00 ― 5 leggere min

Linguaggi di programmazione Valutare i linguaggi di programmazione con regole logiche

Questo articolo esamina i benchmark per valutare le lingue che integrano regole logiche.

2025-10-02T08:46:12+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Avanzare nel Few-Shot Learning con dati audio-visivi

Nuovi metodi migliorano la classificazione video usando pochi dati etichettati.

2025-09-29T11:46:36+00:00 ― 8 leggere min

Apprendimento automatico Languini Kitchen: Un Nuovo Approccio al Modello Linguistico

Languini Kitchen supporta i ricercatori nella modellazione del linguaggio con confronti equi e set di dati migliori.

2025-09-23T23:50:48+00:00 ― 6 leggere min

Apprendimento automatico SALSA-CLRS: Un Nuovo Riferimento per gli Algoritmi

Presentiamo SALSA-CLRS per migliorare la valutazione degli algoritmi usando grafi sparsi.

2025-09-23T14:06:12+00:00 ― 6 leggere min

Informatica distribuita, parallela e in cluster Avanzando la Mascheratura Cloud nella Scienza Atmosferica

La ricerca sottolinea il ruolo dell'IA nel migliorare le tecniche di mascheramento delle nuvole per i dati satellitari.

2025-09-19T20:10:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzando il riconoscimento di parole chiave con dati di parlato letto

Nuovi metodi migliorano il riconoscimento delle parole chiave usando i dati di parlato disponibili.

2025-09-19T13:36:20+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo modello combina analisi delle immagini 2D e 3D

Un nuovo modello integra in modo efficace l'elaborazione delle immagini 2D e 3D.

2025-09-18T21:15:54+00:00 ― 6 leggere min