UniAV kombiniert Aktionslokalisierung, Geräuscherkennung und audio-visuelle Ereignislokalisierung für ein besseres Videoverstehen.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
UniAV kombiniert Aktionslokalisierung, Geräuscherkennung und audio-visuelle Ereignislokalisierung für ein besseres Videoverstehen.
― 8 min Lesedauer
LongVALE setzt einen neuen Massstab dafür, lange Videos durch audio-visuelle Daten zu verstehen.
― 7 min Lesedauer