Le Zhuo

DiffDance erstellt detaillierte Tanzsequenzen, die gut zur Musik passen.

2025-09-29T16:31:20+00:00 ― 6 min Lesedauer

Transformiere Texte nahtlos in Bilder, Videos und Audio mit Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 7 min Lesedauer

Ein neues Modell revolutioniert die Bildgenerierung aus Textbeschreibungen und verbessert verschiedene Branchen.

2025-07-02T04:22:30+00:00 ― 5 min Lesedauer

LLaVA-MoD erstellt kleinere multimodale Modelle mit Wissen von grösseren Vorbildern.

2025-06-20T22:35:24+00:00 ― 6 min Lesedauer

Ein neues Dataset, das das Verständnis von Videos und KI-Überlegungen verbessert.

2025-05-12T04:00:00+00:00 ― 6 min Lesedauer