BBQ kombiniert visuelle Daten und Sprache für eine bessere Objektrückgabe in 3D.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
BBQ kombiniert visuelle Daten und Sprache für eine bessere Objektrückgabe in 3D.
― 6 min Lesedauer
Eine neue Methode für Roboter, um ihre Umgebung mithilfe von 3D-Szenengraphen und Sprachmodellen zu verstehen.
― 6 min Lesedauer