Eine neue Methode verbessert die AU-Erkennung mit unmarkierten Daten.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine neue Methode verbessert die AU-Erkennung mit unmarkierten Daten.
― 5 min Lesedauer
BIMM lernt Videoinhalte, indem es die Gehirnwege von Menschen nachahmt.
― 6 min Lesedauer
MGPT kombiniert Text und Musik, um Bewegung zu kreieren und zu verstehen.
― 9 min Lesedauer
Ein neuer Ansatz verbessert die Modellleistung mit verschiedenen Datenquellen.
― 6 min Lesedauer
Ein neues Tool zur Bewertung von Vorurteilen in grossen Vision-Language-Modellen.
― 6 min Lesedauer
Dysca führt eine neue Möglichkeit ein, die Leistung von LVLM mit synthetischen Daten zu bewerten.
― 7 min Lesedauer
Eine neue Verteidigungsmethode zur Verbesserung der Sicherheit in Text-zu-Bild Diffusionsmodellen.
― 5 min Lesedauer
UniPose integriert mehrere Methoden für ein besseres Verständnis und die Generierung von menschlichen Posen.
― 7 min Lesedauer