Wei-Chiu Ma

Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.

2025-08-18T12:23:42+00:00 ― 7 min Lesedauer

Das Einbeziehen von nicht-englischen Daten verbessert die Leistung von Vision-Language-Modellen und das kulturelle Verständnis.

2025-08-06T05:35:36+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert, wie KI-Modelle räumliche und zeitliche Zusammenhänge interpretieren.

2025-07-03T21:51:00+00:00 ― 6 min Lesedauer

Forscher verwandeln gewöhnliche Videos mit KI-Technologie in immersive 3D-Szenen.

2025-03-26T01:03:00+00:00 ― 8 min Lesedauer