Ein System, das Interaktionen zwischen Leuten und Objekten in Wohnungen verfolgt.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein System, das Interaktionen zwischen Leuten und Objekten in Wohnungen verfolgt.
― 6 min Lesedauer
Untersuchung der Grenzen grosser Vision-Language-Modelle beim detaillierten Verständnis von Bildern.
― 7 min Lesedauer
ARMADA verbessert die Bild-Text-Zuordnung durch attributfokussierte Datenerstellung.
― 9 min Lesedauer
Kombination von Lernen und Kontrolle für mehr Sicherheit bei laufenden Robotern.
― 7 min Lesedauer
Neue Forschung zeigt, dass schlecht abschneidende Modelle wertvolle Einblicke in die Wichtigkeit von Merkmalen bieten können.
― 6 min Lesedauer