UniAV kombiniert Aktionslokalisierung, Geräuscherkennung und audio-visuelle Ereignislokalisierung für ein besseres Videoverstehen.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
UniAV kombiniert Aktionslokalisierung, Geräuscherkennung und audio-visuelle Ereignislokalisierung für ein besseres Videoverstehen.
― 8 min Lesedauer
Die Qualität der Textgenerierung verbessern, indem man saubere Beispiele auswählt.
― 8 min Lesedauer
LLplace vereinfacht das 3D-Layout-Design mit natürlicher Spracheingabe.
― 6 min Lesedauer
ARIO standardisiert Daten, um das Training und die Anpassungsfähigkeit von Robotern zu verbessern.
― 11 min Lesedauer
LongVALE setzt einen neuen Massstab dafür, lange Videos durch audio-visuelle Daten zu verstehen.
― 7 min Lesedauer
Eine neue Plattform, wo Roboter Interaktionen und Fähigkeiten wie Menschen lernen können.
― 8 min Lesedauer
Neue Techniken verbessern die Anomalieerkennung in lauten Datenumgebungen in verschiedenen Branchen.
― 6 min Lesedauer