Un nuovo modello TTS aggiunge profondità emotiva alla voce generata dal computer.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modello TTS aggiunge profondità emotiva alla voce generata dal computer.
― 6 leggere min
TROPE migliora le didascalie delle immagini concentrandosi sulle parti degli oggetti per avere più dettagli.
― 5 leggere min
Il nuovo modello VoiceGuider migliora il TTS per relatori diversi.
― 6 leggere min
Un nuovo approccio integra video delle lezioni e slide per un coinvolgimento migliore degli studenti.
― 6 leggere min
L'assistente vocale aiuta gli utenti a navigare nell'e-commerce senza sforzo.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento vocale per registrazioni lunghe.
― 5 leggere min
I ricercatori stanno migliorando la comprensione del linguaggio dei segni americano da parte dei computer.
― 5 leggere min
Nuovi metodi migliorano il sottotitolaggio dei video con meno esempi.
― 5 leggere min
MACE migliora la didascalia audio collegando i suoni a descrizioni testuali accurate.
― 5 leggere min
Fish-Speech migliora la tecnologia vocale per un'esperienza di comunicazione più naturale.
― 6 leggere min
SPECTRUM migliora i sottotitoli dei video integrando emozioni e contesto per un'esperienza di visione migliore.
― 5 leggere min
Esplorare come la tecnologia del tracciamento degli occhi migliori la selezione nella realtà virtuale e aumentata.
― 7 leggere min
V-Buddy offre un'esperienza di chat amichevole per chi ha difficoltà motorie.
― 6 leggere min
Uno sguardo alle stranezze di girare manopole senza vedere.
― 5 leggere min
L'AI economica sui dispositivi piccoli rende la tecnologia smart accessibile a tutti.
― 4 leggere min
Un nuovo sistema aiuta a colmare il divario nella comunicazione tra utenti della lingua dei segni e chi non la usa.
― 8 leggere min
Signformer rivoluziona la traduzione della lingua dei segni attraverso metodi video-testo efficienti.
― 6 leggere min
Modifica i video senza sforzo semplicemente parlando delle tue modifiche.
― 5 leggere min
SwissADT traduce le descrizioni audio per migliorare la visione per le persone non vedenti in Svizzera.
― 4 leggere min
Nuovo framework migliora le transizioni nei video di lingua dei segni per una comprensione migliore.
― 6 leggere min
La stampa 3D offre una soluzione economica per stampelle personalizzate.
― 7 leggere min
DistinctAD offre un nuovo metodo per generare descrizioni audio uniche nei film.
― 4 leggere min
Scopri come la nuova tecnologia trasforma le immagini in esperienze sonore immersive.
― 7 leggere min
Migliorare gli Assistenti Vocali per persone sorde e con problemi di udito.
― 5 leggere min
Esplora come le tecnologie immersive stanno cambiando le esperienze del patrimonio culturale.
― 6 leggere min
Nuova tecnologia crea video in lingua dei segni per la comunità sorda e ipoudente.
― 8 leggere min
Scopri come il suono aiuta i non vedenti a orientarsi nell'ambiente.
― 7 leggere min
Le mappe tattili automatiche potrebbero cambiare la vita di chi ha disabilità visive.
― 5 leggere min
Un nuovo dataset migliora l'accesso alle risorse legali bilingue in Belgio.
― 6 leggere min
Nuovo dataset aiuta le macchine a imparare le lingue parlate e i linguaggi dei segni.
― 8 leggere min
Scopri come CBraMod trasforma i dati EEG per migliorare le interfacce cervello-computer.
― 4 leggere min
Nuova tecnologia permette agli utenti di controllare i dispositivi con il pensiero.
― 7 leggere min
Scopri come le macchine adesso raccontano storie attraverso le immagini.
― 7 leggere min
Un strumento di riconoscimento vocale trasforma la matematica parlata in LaTeX senza sforzo.
― 6 leggere min
SightGlow migliora le esperienze online per le persone con daltonismo.
― 5 leggere min
Usare l'IoT per aiutare le persone non vedenti nei trasporti urbani.
― 4 leggere min
Rivoluzionando il testo parlato con voci più naturali e un'efficienza migliorata.
― 6 leggere min
Migliorare l'accesso alle informazioni in lingue a basso costo come l'urdu.
― 6 leggere min
Esplorare le sfide e il potenziale dell'OCR nel riconoscere lingue a bassa risorsa.
― 8 leggere min
Un nuovo framework migliora l'accuratezza della traduzione dei segni per una comunicazione migliore.
― 7 leggere min