Junjie Zhou

VISTA verbessert, wie wir Informationen finden, indem es Text und Bilder kombiniert.

2025-08-01T12:53:12+00:00 ― 7 min Lesedauer

Das MLVU-Benchmark hat das Ziel, das maschinelle Verständnis von langen Videos zu verbessern.

2025-08-01T11:57:54+00:00 ― 6 min Lesedauer

OmniGen vereinfacht die Bildgenerierung für alle Nutzer in einem einzigen Modell.

2025-06-10T17:49:18+00:00 ― 6 min Lesedauer

Video-XL verarbeitet lange Videos effizient und verbessert Genauigkeit und Leistung.

2025-06-08T02:29:24+00:00 ― 6 min Lesedauer

Lern, wie TCS die Effizienz und Anpassungsfähigkeit des KI-Modelltrainings verbessert.

2025-03-16T04:18:45+00:00 ― 8 min Lesedauer

MegaPairs verbindet Bilder und Text für bessere Suchergebnisse.

2025-02-21T02:35:15+00:00 ― 6 min Lesedauer