L'app RASSAR migliora la sicurezza e l'accessibilità a casa usando tecnologie avanzate.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
L'app RASSAR migliora la sicurezza e l'accessibilità a casa usando tecnologie avanzate.
― 5 leggere min
Nuovi metodi puntano a migliorare la comunicazione per la comunità sorda.
― 5 leggere min
Un metodo per migliorare la precisione del riconoscimento vocale nelle lingue kannada e telugu.
― 8 leggere min
Un nuovo modo per creare didascalie più informative per le immagini.
― 8 leggere min
RALL-E migliora la sintesi testo-parola per un parlato più chiaro e naturale.
― 5 leggere min
Un nuovo metodo migliora la chiarezza e l'espressività nella lingua dei segni.
― 6 leggere min
Presentiamo un nuovo approccio per migliorare l'analisi del layout del testo nelle immagini.
― 6 leggere min
Scopri come migliorare gli agenti UI può creare esperienze utente migliori.
― 8 leggere min
Un nuovo metodo crea direttamente i sottotitoli, migliorando l'accessibilità per diversi tipi di pubblico.
― 8 leggere min
Esaminare come la tecnologia possa esprimere meglio le emozioni nella comunicazione.
― 7 leggere min
Nuovi metodi migliorano come l'IA collega testo e immagini per risultati migliori.
― 8 leggere min
Uno studio rivela le frustrazioni e le preferenze degli utenti riguardo ai CAPTCHA nei siti web.
― 8 leggere min
Presentiamo un modello che genera audio e video sincronizzati con livelli di rumore misti.
― 6 leggere min
Questo sistema aiuta le persone non vedenti a fare la spesa in modo più indipendente usando un bastone robotico.
― 6 leggere min
Un nuovo metodo migliora il modo in cui le macchine trasmettono informazioni visive agli esseri umani.
― 6 leggere min
Seed-TTS crea una voce realistica partendo dal testo per vari usi.
― 5 leggere min
Un nuovo metodo crea didascalie per i video migliori concentrandosi sulle narrazioni e sulla causalità.
― 5 leggere min
Un nuovo approccio alla captioning audio riduce la dipendenza dai dati abbinati.
― 6 leggere min
Un nuovo modo per prevedere i cambiamenti dell'interfaccia delle app mobili basati sulle azioni degli utenti.
― 5 leggere min
Usare il suono per rendere i dati astronomici più accessibili e coinvolgenti per tutti.
― 8 leggere min
Un progetto mescola danza e tecnologia per esprimere creatività.
― 6 leggere min
ReadCtrl permette ai modelli di linguaggio di adattare meglio la complessità del testo alle capacità del lettore.
― 5 leggere min
GigaSpeech 2 offre un'enorme raccolta di dati per le lingue a bassa risorsa per migliorare il riconoscimento vocale.
― 5 leggere min
Esaminando la necessità di contesto nella traduzione precisa della lingua dei segni.
― 6 leggere min
Un sistema combina audio e video per migliorare l'accuratezza del riconoscimento degli speaker.
― 5 leggere min
PenSLR aiuta a migliorare la comunicazione per le persone sorde e con problemi di udito usando la lingua dei segni.
― 6 leggere min
Un nuovo sistema di intelligenza artificiale migliora l'accessibilità per gli utenti con disabilità visive attraverso una migliore lettura dello schermo.
― 5 leggere min
Concentrati su un'AI accessibile e spiegabile per le persone con disabilità.
― 6 leggere min
UniGloR offre un nuovo modo per tradurre e produrre la lingua dei segni senza gloss.
― 8 leggere min
La ricerca trova modi per migliorare le didascalie delle immagini per le persone non vedenti tramite la rilevanza culturale.
― 7 leggere min
Un metodo per migliorare i sistemi TTS per una pronuncia migliore delle parole OOV in India.
― 5 leggere min
Nuove tecniche migliorano la generazione di voci sintetiche con pochissimi dati.
― 5 leggere min
AutoAD-Zero utilizza suggerimenti visivi per descrizioni audio più rapide ed efficaci.
― 7 leggere min
Un grande dataset aiuta a migliorare la comunicazione per gli utenti sordi con gli smartphone.
― 5 leggere min
SLVideo aiuta gli utenti a trovare facilmente momenti specifici nei video in lingua dei segni.
― 6 leggere min
Un'antenna radar indossabile flessibile migliora la mobilità per le persone non vedenti.
― 4 leggere min
Un strumento di comando vocale aiuta gli utenti non vedenti a navigare facilmente nelle app.
― 8 leggere min
Usare modelli visivi-linguistici per migliorare l'accuratezza e l'accessibilità delle mappe urbane.
― 5 leggere min
Magiv2 punta a migliorare l'accesso ai manga per persone con disabilità visive tramite trascrizioni automatiche.
― 6 leggere min
Un'app innovativa aiuta gli utenti a riconoscere e nominare i colori in modo efficace.
― 7 leggere min