DiffI2I verbessert die Bild-zu-Bild-Übersetzung mit höherer Genauigkeit und Effizienz.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
DiffI2I verbessert die Bild-zu-Bild-Übersetzung mit höherer Genauigkeit und Effizienz.
― 6 min Lesedauer
DAVIS bietet einen neuen Ansatz für die Trennung von Audio und visuellem Klang.
― 6 min Lesedauer
Spica verbessert den Videozugang für blinde und sehbehinderte Nutzer durch Interaktivität.
― 5 min Lesedauer
Mimosa macht die Erstellung von räumlichem Audio für Amateur-Videomacher super einfach.
― 8 min Lesedauer
AV-DiT bietet eine neue Möglichkeit, synchronen Audio und Video effizient zu erzeugen.
― 8 min Lesedauer
Ein neues AR-System, das die Küchensicherheit für Menschen mit Sehbehinderungen verbessert.
― 6 min Lesedauer
SaSR-Net verbindet Sounds und Bilder, um Fragen zu Videos genau zu beantworten.
― 7 min Lesedauer
Die Studie verbessert das Videoverständnis durch bewegungsfokussierte Fragen und visuelle Antworten.
― 6 min Lesedauer