Yuxuan Wang

Visione artificiale e riconoscimento di modelli Presentiamo STAIR: Un Nuovo Modello per Rispondere a Domande su Video

STAIR migliora il video question answering suddividendo le domande in compiti gestibili.

2025-09-18T09:48:36+00:00 ― 6 leggere min

Elettroni fortemente correlati Nuove intuizioni sugli isolanti topologici di ordine superiore

I ricercatori propongono un nuovo modo per misurare le cariche angolari nei materiali avanzati.

2025-09-08T05:35:45+00:00 ― 8 leggere min

Elettroni fortemente correlati Esaminando Sistemi Fermionici Senza Gap e Isolanti Topologici

La ricerca mette in evidenza le connessioni tra i sistemi fermionici senza gap e gli isolanti topologici.

2025-09-04T08:34:24+00:00 ― 7 leggere min

Apprendimento automatico Migliorare le previsioni delle serie temporali con TimeXer

TimeXer integra fattori esterni per migliori previsioni delle serie temporali.

2025-09-02T19:13:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli HawkEye: Un Nuovo Modello per la Comprensione di Video Lunghi

HawkEye migliora i modelli video-testo per gestire video più lunghi in modo efficace.

2025-08-28T23:52:42+00:00 ― 6 leggere min

Grafica Sviluppi nell'editing 3D con VcEdit

VcEdit migliora il editing 3D assicurando coerenza tra più visualizzazioni.

2025-08-28T06:37:48+00:00 ― 5 leggere min

Crittografia e sicurezza Garantire la fiducia digitale: il ruolo dei PUF nella PKI

Scopri come le Funzioni Fisicamente Inclonabili migliorano la sicurezza nell'Infrastruttura a Chiave Pubblica.

2025-08-16T22:52:12+00:00 ― 6 leggere min

Interazione uomo-macchina Ripensare l'educazione musicale con l'IA

Flute X GPT trasforma l'apprendimento del flauto attraverso sessioni interattive guidate dall'IA.

2025-08-10T03:52:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia Text-to-Speech

Seed-TTS crea una voce realistica partendo dal testo per vari usi.

2025-08-01T10:39:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Valutare le allucinazioni nei modelli video-linguistici

Un nuovo benchmark valuta come i modelli video-linguistici gestiscono efficacemente le imprecisioni.

2025-07-24T17:47:18+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Seed-ASR: Avanzare nella tecnologia di riconoscimento vocale

Un nuovo modello migliora la precisione nelle capacità di trascrizione vocale in più lingue.

2025-07-21T14:43:45+00:00 ― 5 leggere min

Suono Avanzare nella generazione audio con il dataset Sound-VECaps

Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.

2025-07-21T07:26:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il Ragionamento Visivo con Moduli di Verifica

Questo metodo migliora il ragionamento visivo implementando una verifica a ogni passo del ragionamento.

2025-07-02T15:49:48+00:00 ― 7 leggere min

Elettroni fortemente correlati Capire le superfici di Fermi nei campi magnetici

Questo articolo analizza il comportamento degli elettroni vicino alle superfici di Fermi sotto deboli campi magnetici.

2025-06-25T03:37:42+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo framework migliora i modelli video-linguistici

Un framework che usa token di memoria migliora la comprensione e l'interazione con i video.

2025-06-18T08:10:48+00:00 ― 7 leggere min

Suono Seed-Music: Semplificare la Creazione Musicale per Tutti

Un sistema che rende la creazione musicale facile e accessibile a tutti, indipendentemente dal livello di abilità.

2025-06-12T13:52:50+00:00 ― 7 leggere min

Suono Fish-Speech: Una Nuova Era nel Testo in Voce

Fish-Speech migliora la tecnologia vocale per un'esperienza di comunicazione più naturale.

2025-05-27T01:41:38+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rivoluzionare l'interazione video: un nuovo modello

Un nuovo modello permette interazioni in tempo reale con i video, migliorando la comprensione e l'engagement.

2025-05-07T14:13:20+00:00 ― 5 leggere min

Elettroni fortemente correlati Elettroni in Movimento: La Danza dei Fenomeni Quantistici

Esplora i comportamenti affascinanti degli elettroni nei campi magnetici.

2025-02-08T23:45:48+00:00 ― 5 leggere min

Calcolo e linguaggio Comprendere le conversazioni multi-modali tra più persone

La ricerca mostra come possiamo far capire alle macchine dialoghi complessi.

2025-01-29T03:16:12+00:00 ― 6 leggere min