Can Qin

Wir stellen SQ-LLaVA vor, eine Methode zur Verbesserung von Bildfragen und -verständnis.

2025-08-28T15:27:06+00:00 ― 8 min Lesedauer

xGen-MM verbessert multimodale Modelle für ein besseres Lernen von Bildern und Texten.

2025-06-27T00:04:54+00:00 ― 6 min Lesedauer

Neue Multi-Maskentechnik verbessert das Maschinenverständnis von 3D-Daten.

2025-06-04T15:32:24+00:00 ― 6 min Lesedauer

DyCoke verbessert das Videoverständnis, indem es die Verarbeitung schneller und effizienter macht.

2025-05-12T17:30:40+00:00 ― 5 min Lesedauer