Neues audio-basiertes Modell verbessert die Lippen-Synchronisation und Realismus.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Neues audio-basiertes Modell verbessert die Lippen-Synchronisation und Realismus.
― 5 min Lesedauer
Ein neuer Datensatz, der darauf abzielt, die Objekterkennung beim Schneiden zu verbessern.
― 7 min Lesedauer
Neue Methoden verbessern die Effizienz von Datenspeicherung und -übertragung, ohne die Qualität zu verlieren.
― 5 min Lesedauer
LiFT verbessert Vision Transformers für detaillierte Bildaufgaben effizient.
― 6 min Lesedauer
Eine Methode zur Bewertung des künstlerischen Stils in erzeugten Bildern.
― 9 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Bild-Text-Zuordnung mithilfe von Dual-Encoder-Modellen und Szenengrafen.
― 6 min Lesedauer
V-VIPE verbessert die 3D-Pose-Schätzung aus 2D-Bildern und meistert dabei die Winkelherausforderungen.
― 8 min Lesedauer
InVi ermöglicht die einfache Hinzufügung von Objekten in Videos mit vorhandenen Tools.
― 6 min Lesedauer
WayEx hilft Robotern, Aufgaben effizienter mit weniger Demonstrationen zu lernen.
― 6 min Lesedauer
Ein neuer Ansatz kombiniert Bewegung und Erscheinung für eine effektive Aktionskennung mit begrenzten Daten.
― 9 min Lesedauer
Eine neue Methode ermöglicht es Maschinen, sich bewegende und sich verändernde Formen genau zu modellieren.
― 8 min Lesedauer
Neue Methoden beschleunigen die Video-Codierung und -Decodierung.
― 5 min Lesedauer
VeriGraph verbessert die Effizienz von Roboterreinigungen mit fortschrittlicher Szenengraph-Technologie.
― 6 min Lesedauer
Ein neues Framework macht das Streamen von dynamischen 3D-Videos schneller und effizienter.
― 8 min Lesedauer
Lerne, wie Videozerlegung das Editing für Creator und Filmemacher verändert.
― 6 min Lesedauer
Neue Methoden verbessern Videovorhersagen mit weniger Daten.
― 7 min Lesedauer