Un nuovo metodo testa come l'IA interpreta grafici fuorvianti.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo testa come l'IA interpreta grafici fuorvianti.
― 6 leggere min
Un nuovo progetto di riferimento punta a valutare le capacità di risoluzione dei problemi di Java.
― 5 leggere min
Un nuovo approccio semplifica la sicurezza e l'aiuto nella formazione dei modelli linguistici.
― 10 leggere min
Migliorare come le macchine assistono gli utenti tramite interazioni e risposte migliori.
― 5 leggere min
Questo studio analizza l'efficacia dei LLM nella musicologia e la loro affidabilità.
― 6 leggere min
Uno strumento completo per valutare i sistemi di calcolo ad alte prestazioni.
― 7 leggere min
Un sistema per registrare e riprodurre azioni nelle app WebAssembly.
― 7 leggere min
Esplorare tecniche di machine learning per un partizionamento efficiente nel design VLSI.
― 6 leggere min
VisScience testa modelli grandi sul ragionamento scientifico usando testi e immagini.
― 5 leggere min
OpenACE offre un buon punto di riferimento per valutare i codec audio in diverse condizioni.
― 6 leggere min
Sforzi per migliorare la tecnologia vocale per la lingua Faetar, che è poco supportata.
― 6 leggere min
Questo documento valuta la capacità dei VLM di ragionare su dimensioni e distanze.
― 6 leggere min
Investigando come gli agenti AI riproducono risultati scientifici tramite un nuovo benchmark.
― 6 leggere min
TDC-2 migliora la ricerca nello sviluppo di farmaci grazie a un accesso ai dati migliore e modelli multimodali.
― 5 leggere min
LightSABRE migliora le prestazioni dei circuiti quantistici con miglioramenti in velocità e qualità.
― 4 leggere min
I ricercatori di fisica delle alte energie stanno ottimizzando il software per risorse di calcolo diverse.
― 9 leggere min
Questo approccio semplifica la scelta di dataset di pretraining efficaci per i modelli linguistici.
― 9 leggere min
Un nuovo modo per valutare i benchmark dell'IA per la comprensione culturale.
― 8 leggere min
Un nuovo metodo genera simulazioni complete in codice a partire da input in linguaggio naturale.
― 9 leggere min
Questo articolo valuta quanto bene i LLM generano casi di test per i programmi Java.
― 8 leggere min
La ricerca mostra che ci sono punti deboli nella rilevazione della tossicità online usando tecniche di arte ASCII.
― 7 leggere min
Esplorando il divario di prestazioni dei modelli generali nei compiti finanziari.
― 6 leggere min
Scopri gli ultimi miglioramenti nella tecnologia di elaborazione del linguaggio arabo e il loro impatto.
― 6 leggere min
Scopri come la tecnologia aiuta a modificare dettagli minuscoli nelle immagini in modo efficace.
― 4 leggere min
Un nuovo benchmark testa gli agenti AI in compiti realistici di CRM.
― 7 leggere min
La contaminazione dei dati influisce sulle prestazioni dei modelli linguistici e sui metodi di valutazione.
― 5 leggere min
Questo articolo parla della necessità di trasparenza nei benchmark dei modelli linguistici.
― 7 leggere min
Le macchine imparano a collegare suoni e immagini in spazi 3D.
― 7 leggere min
Trasformare dati di benchmark complessi in intuizioni visive chiare.
― 7 leggere min
Milabench offre benchmark personalizzati per migliorare le valutazioni delle prestazioni dell'IA.
― 5 leggere min
I ricercatori creano strumenti per migliorare la comprensione dell'IA della lingua ucraina.
― 6 leggere min
I compiti di NLI sono ancora rilevanti per testare i modelli di linguaggio grandi?
― 6 leggere min
I ricercatori hanno sviluppato un nuovo benchmark per studiare le mutazioni somatiche a bassa frequenza nella genetica.
― 9 leggere min
Uno sguardo ai metodi di inferenza causale e al ruolo dei Modelli Causali Strutturali.
― 6 leggere min
Uno sguardo alle sfide di abbinare i server alle richieste in mezzo all'incertezza.
― 6 leggere min
VidHal valuta quanto bene i modelli video riescono a interpretare accuratamente i contenuti.
― 6 leggere min
Uno sguardo al comportamento delle onde di Marshak in condizioni complesse.
― 6 leggere min
Questo articolo esplora i miglioramenti nel reinforcement learning offline suddividendo le azioni.
― 12 leggere min
Un nuovo metodo migliora il conteggio nelle immagini usando LVLM.
― 5 leggere min
Scopri come gli investitori possono fare scelte di guadagno migliori.
― 5 leggere min