Un nuovo sistema aiuta i telespettatori non vedenti a capire meglio i video brevi.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo sistema aiuta i telespettatori non vedenti a capire meglio i video brevi.
― 5 leggere min
Approcci innovativi stanno migliorando l'accesso all'istruzione per le comunità svantaggiate.
― 8 leggere min
Nuove tecniche migliorano i sistemi ASR per riconoscere meglio discorsi lunghi.
― 5 leggere min
La semplificazione del testo aiuta a migliorare l'accesso alle informazioni per lettori diversi.
― 6 leggere min
Uno studio su come rendere le immagini scientifiche accessibili a chi ha deficit di visione dei colori.
― 6 leggere min
Questo progetto migliora i sistemi di traduzione vocale in tempo reale e di sottotitolazione automatica.
― 4 leggere min
MAIDR aiuta gli utenti non vedenti ad accedere a visualizzazioni dei dati tramite suono, tatto e testo.
― 8 leggere min
Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.
― 5 leggere min
Chart4Blind trasforma grafici complessi in formati accessibili per utenti non vedenti.
― 7 leggere min
Uno sguardo a come la tecnologia AVQA risponde alle domande usando video e audio.
― 6 leggere min
La ricerca rivela le preferenze degli utenti BLV per l'accesso ai video.
― 6 leggere min
Un metodo per aiutare i non vedenti a riconoscere i suoni nella realtà mista.
― 5 leggere min
Un nuovo modello migliora l'efficienza del riconoscimento vocale in tempo reale.
― 6 leggere min
Il nostro modello genera testo di suggerimento per migliorare l'usabilità per gli utenti ipovedenti.
― 5 leggere min
Nuovi metodi migliorano l'accessibilità e l'accuratezza nei sottotitoli audio.
― 6 leggere min
L'app RASSAR migliora la sicurezza e l'accessibilità a casa usando tecnologie avanzate.
― 5 leggere min
Nuovi metodi puntano a migliorare la comunicazione per la comunità sorda.
― 5 leggere min
Un metodo per migliorare la precisione del riconoscimento vocale nelle lingue kannada e telugu.
― 8 leggere min
Un nuovo modo per creare didascalie più informative per le immagini.
― 8 leggere min
RALL-E migliora la sintesi testo-parola per un parlato più chiaro e naturale.
― 5 leggere min
Un nuovo metodo migliora la chiarezza e l'espressività nella lingua dei segni.
― 6 leggere min
Presentiamo un nuovo approccio per migliorare l'analisi del layout del testo nelle immagini.
― 6 leggere min
Scopri come migliorare gli agenti UI può creare esperienze utente migliori.
― 8 leggere min
Un nuovo metodo crea direttamente i sottotitoli, migliorando l'accessibilità per diversi tipi di pubblico.
― 8 leggere min
Esaminare come la tecnologia possa esprimere meglio le emozioni nella comunicazione.
― 7 leggere min
Nuovi metodi migliorano come l'IA collega testo e immagini per risultati migliori.
― 8 leggere min
Uno studio rivela le frustrazioni e le preferenze degli utenti riguardo ai CAPTCHA nei siti web.
― 8 leggere min
Presentiamo un modello che genera audio e video sincronizzati con livelli di rumore misti.
― 6 leggere min
Questo sistema aiuta le persone non vedenti a fare la spesa in modo più indipendente usando un bastone robotico.
― 6 leggere min
Un nuovo metodo migliora il modo in cui le macchine trasmettono informazioni visive agli esseri umani.
― 6 leggere min
Seed-TTS crea una voce realistica partendo dal testo per vari usi.
― 5 leggere min
Un nuovo metodo crea didascalie per i video migliori concentrandosi sulle narrazioni e sulla causalità.
― 5 leggere min
Un nuovo approccio alla captioning audio riduce la dipendenza dai dati abbinati.
― 6 leggere min
Un nuovo modo per prevedere i cambiamenti dell'interfaccia delle app mobili basati sulle azioni degli utenti.
― 5 leggere min
Usare il suono per rendere i dati astronomici più accessibili e coinvolgenti per tutti.
― 8 leggere min
Un progetto mescola danza e tecnologia per esprimere creatività.
― 6 leggere min
ReadCtrl permette ai modelli di linguaggio di adattare meglio la complessità del testo alle capacità del lettore.
― 5 leggere min
GigaSpeech 2 offre un'enorme raccolta di dati per le lingue a bassa risorsa per migliorare il riconoscimento vocale.
― 5 leggere min
Esaminando la necessità di contesto nella traduzione precisa della lingua dei segni.
― 6 leggere min
Un sistema combina audio e video per migliorare l'accuratezza del riconoscimento degli speaker.
― 5 leggere min