Zechen Bai

Eine neue Methode verbessert die Videoobjekterkennung ohne beschriftete Daten.

2025-09-25T10:20:36+00:00 ― 6 min Lesedauer

Eine neue Methode, um Gesichtsanimationen effizient für individuelle Charaktere mithilfe von Deep Learning zu erstellen.

2025-09-05T11:20:24+00:00 ― 5 min Lesedauer

Ein kurzer Blick auf Halluzinationen in MLLMs und Strategien zur Verbesserung der Zuverlässigkeit.

2025-08-15T14:44:36+00:00 ― 7 min Lesedauer

Neue Methoden verbessern multimodale Modelle, indem sie Fragen und Bewertungsaufgaben hinzufügen.

2025-08-08T12:22:00+00:00 ― 9 min Lesedauer

Diese Methode passt die Slots für die Objektrepräsentation je nach Bildkomplexität an.

2025-07-29T07:59:36+00:00 ― 6 min Lesedauer

VideoLISA nutzt Sprache, um Objekte in Videos effektiv zu segmentieren und zu verfolgen.

2025-06-03T09:15:24+00:00 ― 7 min Lesedauer

Die faktorisierten Quantisierung verbessert die Bildgenerierung durch effizientes Token-Management.

2025-05-09T02:57:20+00:00 ― 6 min Lesedauer