Ting Liu

Neue Methode verbessert die Videountertitelung mit Bild-Sprachmodellen.

2025-09-17T18:48:00+00:00 ― 7 min Lesedauer

Diese Studie untersucht, wie verschiedene Datenquellen grosse Sprachmodelle beeinflussen.

2025-09-06T21:34:24+00:00 ― 7 min Lesedauer

VideoPrism hilft dabei, Videoinhalte effektiv zu interpretieren und zu analysieren.

2025-09-05T19:53:54+00:00 ― 6 min Lesedauer

M IST verbessert die Interaktion zwischen visuellen und Sprachmodellen für eine bessere Leistung.

2025-07-21T10:39:24+00:00 ― 6 min Lesedauer

SE-GPT verbessert Sprachmodelle durch autonomes Lernen aus Erfahrungen im Laufe der Zeit.

2025-07-15T12:03:42+00:00 ― 6 min Lesedauer

Ein neues Modell, um 3D-Umgebungen mit textbasierten Beschreibungen zu verstehen.

2025-07-11T02:35:48+00:00 ― 5 min Lesedauer

Ein neuer Ansatz, um die Texteingaben für Bild-zu-Text-Modelle zu verbessern und bessere Ergebnisse zu erzielen.

2025-07-09T19:45:24+00:00 ― 6 min Lesedauer

UniCE verbessert die Extraktion von Ursache-Wirkung-Ereignissen in komplexen Sätzen.

2025-07-01T09:56:30+00:00 ― 6 min Lesedauer

Neue Methoden verbessern die Genauigkeit und Effizienz der Video-Segmentierung für verschiedene Anwendungen.

2025-06-24T21:23:24+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert Sprachmodelle, indem sie Wissensdefizite ohne beschriftete Daten diagnostiziert.

2025-06-24T04:55:54+00:00 ― 6 min Lesedauer

Ein Verfahren vorstellen, um die Bildgenerierung aus komplexen Textbeschreibungen zu verbessern.

2025-06-22T12:38:30+00:00 ― 5 min Lesedauer

MaPPER bietet eine neue Methode für effizientes Verständnis von Bild und Text.

2025-06-08T21:50:42+00:00 ― 5 min Lesedauer

Diese Studie zeigt, wie LLMs ihr Lernen durch Aufmerksamkeitsmuster anpassen.

2025-06-06T11:07:18+00:00 ― 7 min Lesedauer

TROP2 spielt eine wichtige Rolle beim Widerstand von Krebs gegenüber Immunangriffen.

2025-05-13T08:33:32+00:00 ― 7 min Lesedauer

Erstelle ganz einfach Videos aus Democlips und Kontextbildern.

2025-03-16T21:58:03+00:00 ― 6 min Lesedauer

Die Art und Weise, wie wir Text in Bildern mit Stil und Kontext übersetzen, revolutionieren.

2025-02-02T01:09:45+00:00 ― 6 min Lesedauer