Questo studio valuta le reti neurali per replicare le caratteristiche del riverbero a molla.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio valuta le reti neurali per replicare le caratteristiche del riverbero a molla.
― 8 leggere min
ParaEVITS migliora l'espressione emotiva nel TTS attraverso la guida del linguaggio naturale.
― 5 leggere min
Nuovi metodi migliorano l'accesso alle notizie parlate segmentando meglio gli argomenti.
― 7 leggere min
SoloAudio migliora l'estrazione del suono usando tecniche avanzate e dati sintetici.
― 5 leggere min
Nuovo modello migliora il riconoscimento del parlante in tempo reale e l'efficienza nella comunicazione.
― 6 leggere min
Un nuovo modello migliora la generazione audio usando testi e suoni dettagliati.
― 6 leggere min
MusicLIME spiega come l'AI analizza la musica tramite audio e testi.
― 6 leggere min
Un nuovo modello crea audio che si abbina al video, migliorando le esperienze media.
― 5 leggere min
Un nuovo approccio integra video delle lezioni e slide per un coinvolgimento migliore degli studenti.
― 6 leggere min
Questo studio analizza come audio, video e testo lavorano insieme nel riconoscimento vocale.
― 7 leggere min
I ricercatori uniscono segnali audio e visivi per rilevare le bugie in modo più preciso.
― 6 leggere min
PIAST offre una collezione unica di musica per pianoforte per i ricercatori.
― 5 leggere min
La tecnologia di rilevamento dei deepfake punta a identificare i video falsi prima che ingannino gli spettatori.
― 6 leggere min
Combinare registrazioni audio con spartiti per praticare meglio.
― 6 leggere min
AEROMamba migliora l'audio di bassa qualità trasformandolo in un suono ricco e ad alta fedeltà.
― 5 leggere min
DTAM offre una soluzione potente per ricostruire dati da informazioni incomplete.
― 7 leggere min
Un nuovo metodo migliora la chiarezza del parlato usando informazioni visive dall'ambiente circostante.
― 5 leggere min
FabuLight-ASD migliora il riconoscimento degli speaker combinando dati audio, visivi e di movimento del corpo.
― 5 leggere min
Un nuovo metodo mira a rilevare l'origine delle voci sintetiche.
― 7 leggere min
Nuovo addestramento audio migliora le performance e la versatilità degli agenti di Minecraft.
― 6 leggere min
Nuovi metodi puntano a identificare discorsi abusivi nelle lingue indiane tramite rilevazione audio.
― 6 leggere min
La rilevazione del parlante attivo migliora la comunicazione identificando i relatori in ambienti complessi.
― 6 leggere min
SyncFlow unisce la generazione di audio e video per una creazione di contenuti senza soluzione di continuità.
― 4 leggere min
Un nuovo sistema migliora le ricerche video combinando fotogrammi e audio.
― 5 leggere min
Scopri come ASDnB migliora il riconoscimento degli oratori attraverso il linguaggio del corpo e le espressioni facciali.
― 8 leggere min
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
― 6 leggere min
Un nuovo sistema rivoluziona il modo in cui la musica si abbina ai contenuti video.
― 6 leggere min
Trasforma il tuo canticchiare e battere delle mani in audio di alta qualità con Sketch2Sound.
― 7 leggere min
Scopri come vengono identificati i brani reinterpretati su YouTube usando metodi nuovi.
― 6 leggere min
Scopri come JoVALE migliora la comprensione delle azioni nei video.
― 7 leggere min
TAME usa il suono per rilevare i droni, migliorando la sicurezza e il monitoraggio.
― 6 leggere min
La tecnologia audio offre un modo economico per tenere traccia dei UAV in sicurezza.
― 6 leggere min
Un nuovo sistema rivoluziona il modo in cui i sound designer creano audio per i video.
― 8 leggere min
Nuova tecnologia combina suoni e immagini per una migliore rilevazione dei droni.
― 7 leggere min
VERSA valuta bene la qualità del parlato, dell'audio e della musica.
― 9 leggere min
Scopri come il testo può trasformarsi in audio con modelli all'avanguardia.
― 3 leggere min