Yanjie Wang

Neues Modell verbessert das Tracking und die Erkennung von Text in Videoinhalten.

2025-09-18T07:18:30+00:00 ― 4 min Lesedauer

Wir stellen ein neues Modell vor, das Text und Layout effizient kombiniert, um das Verständnis von Dokumenten zu verbessern.

2025-07-20T12:48:00+00:00 ― 5 min Lesedauer

Ein neuer Ansatz verbessert die Videoanalyse mit dynamischen Token-Systemen.

2025-03-16T21:09:54+00:00 ― 9 min Lesedauer