Forscher entwickeln Benchmarks für Vision-Language-Modelle, um über unerwartete Ereignisse in Videos nachzudenken.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Forscher entwickeln Benchmarks für Vision-Language-Modelle, um über unerwartete Ereignisse in Videos nachzudenken.
― 7 min Lesedauer