Articoli più recenti per Valutazione delle prestazioni

Apprendimento automatico CDALBench: Un Nuovo Benchmark per l'Apprendimento Attivo

CDALBench offre un terreno di prova affidabile per vari metodi di Active Learning.

2025-07-03T16:11:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Un nuovo metodo per stimare le prestazioni senza dati di addestramento

Presentiamo un metodo per stimare le prestazioni del modello senza fare affidamento sui dati di addestramento.

2025-07-02T15:41:54+00:00 ― 6 leggere min

Calcolo e linguaggio Impatto delle restrizioni di formato sulle prestazioni dei LLM

Questo articolo esplora come la generazione strutturata influisce sul ragionamento e sulla comprensione dei modelli linguistici.

2025-07-02T00:09:42+00:00 ― 5 leggere min

Architettura hardware Sviluppi nelle tecnologie di calcolo ad alta frequenza

Esplorando i benefici del computing criogenico e superconduttore per una maggiore velocità ed efficienza.

2025-07-01T12:58:12+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Valutare SAM2 nell'imaging medicale 3D

Uno sguardo sulle performance e le sfide di SAM2 nella segmentazione delle immagini mediche.

2025-06-25T09:06:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la valutazione della qualità delle azioni a lungo termine

Un nuovo metodo migliora la valutazione delle performance in video lunghi.

2025-06-24T09:56:06+00:00 ― 6 leggere min

Apprendimento automatico Sfide e intuizioni nell'apprendimento multi-task

Esplorando come l'apprendimento multi-task influisca sulle prestazioni e sulla generalizzazione del modello.

2025-06-22T07:06:42+00:00 ― 6 leggere min

Apprendimento automatico Analizzando Machine Learning vs. Deep Learning per Dati Tabulari

Questo studio confronta il machine learning e il deep learning su dataset tabulari per capire quanto siano efficaci.

2025-06-21T06:37:18+00:00 ― 7 leggere min

Computer e società Un Nuovo Modo per Valutare gli Studi Legali

Il nostro sistema di ranking usa risultati reali per valutare meglio le performance degli studi legali.

2025-06-20T09:49:06+00:00 ― 13 leggere min

Informatica distribuita, parallela e in cluster Gestire le anomalie di tempistica nei compiti di auto-sospensione

Strategie per gestire i problemi di tempistica nella pianificazione dei compiti periodici.

2025-06-18T18:42:48+00:00 ― 6 leggere min

Crittografia e sicurezza Ottimizzare il Machine Learning su hardware sicuro

Migliorare l'efficienza nel trattamento sicuro delle attività di machine learning.

2025-06-17T06:14:30+00:00 ― 7 leggere min

Calcolo e linguaggio Prevedere le performance dei modelli linguistici con meno valutazioni

Un nuovo modo per valutare i modelli di linguaggio in modo efficiente.

2025-06-16T14:26:30+00:00 ― 7 leggere min

Robotica Migliorare le valutazioni dell'apprendimento dei robot per ottenere migliori intuizioni

Migliorare le valutazioni dei robot può portare a intuizioni più profonde sulle loro capacità.

2025-06-12T03:00:06+00:00 ― 8 leggere min

Software matematico Nuova libreria migliora l'ottimizzazione multiobiettivo basata su gradienti

Una nuova libreria migliora i metodi per gestire problemi complessi di ottimizzazione multiobiettivo.

2025-06-12T01:27:35+00:00 ― 5 leggere min

Ingegneria del software Valutare i nuovi modelli di codifica di OpenAI

Questo articolo recensisce i nuovi modelli di codifica di OpenAI e le loro prestazioni nelle applicazioni web.

2025-06-09T17:12:00+00:00 ― 5 leggere min

Informatica neurale ed evolutiva Algoritmi Qualità-Diversità: Bilanciare Prestazioni e Riproducibilità

Esaminare il ruolo della riproducibilità negli algoritmi di Qualità-Diversità per applicazioni nel mondo reale.

2025-06-08T15:47:18+00:00 ― 7 leggere min

Apprendimento automatico Nuovo Metodo per Rilevare i Punti di Soglia nei Dati

Un approccio di deep learning migliora l'accuratezza nella rilevazione dei punti di ginocchio in set di dati rumorosi.

2025-06-07T19:46:30+00:00 ― 8 leggere min

Intelligenza artificiale Valutare l'AI: Sfide e Metodi

Valutare le capacità dell'IA è fondamentale per sicurezza ed efficacia.

2025-06-06T19:09:12+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare agenti AI nei sistemi CRM

Un nuovo benchmark testa gli agenti AI in compiti realistici di CRM.

2025-05-31T13:19:00+00:00 ― 7 leggere min

Apprendimento automatico Un nuovo approccio per valutare gli algoritmi di apprendimento per rinforzo

Presentiamo un metodo affidabile per valutare le prestazioni degli algoritmi RL attraverso una funzione di gap.

2025-05-31T01:55:44+00:00 ― 6 leggere min

Ottimizzazione e controllo Un Nuovo Approccio ai Problemi di Ottimizzazione degli Insiemi

Introducendo un metodo per trovare soluzioni debolmente minime nell'ottimizzazione insiemistica.

2025-05-30T15:49:46+00:00 ― 4 leggere min

Basi di dati Capire le transazioni nel database e il loro valore

Scopri come le transazioni nel database garantiscono coerenza e efficienza dei dati.

2025-05-25T16:37:39+00:00 ― 8 leggere min

Apprendimento automatico Presentiamo Milabench: Un Nuovo Strumento di Benchmark per la Ricerca sull'AI

Milabench offre benchmark personalizzati per migliorare le valutazioni delle prestazioni dell'IA.

2025-05-20T12:26:06+00:00 ― 5 leggere min

Robotica Nuovo metodo per testare le pinze robotiche morbide

SoGraB offre un modo standardizzato per valutare le prestazioni dei gripper morbidi su oggetti fragili.

2025-05-03T02:33:20+00:00 ― 7 leggere min

Economia teorica Strategie Vincenti: Il Ruolo degli Standard di Prestazione nei Tornei

Esplora come gli standard di prestazione influenzano la competizione e la distribuzione dei premi.

2025-04-13T15:26:15+00:00 ― 8 leggere min

Robotica L'impatto della collaborazione umano-robot

Esaminando come la difficoltà del compito influisce sull'assistenza del robot e sull'esperienza dell'utente.

2025-04-08T03:37:48+00:00 ― 7 leggere min

Ricerca sulle cure primarie Presentiamo TAPP: Un Punto di Riferimento nella Cura Primaria

TAPP aiuta le cliniche a valutare le loro prestazioni per offrire una migliore assistenza ai pazienti.

2025-04-01T02:13:10+00:00 ― 7 leggere min

Apprendimento automatico DISCO: Scegliere i Migliori Modelli AI

Un nuovo metodo per selezionare modelli AI pre-addestrati in modo efficiente.

2025-01-23T21:16:39+00:00 ― 7 leggere min