Ein grosses Datenset aus Prompts und Videos bringt die Text-zu-Video-Technologie voran.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein grosses Datenset aus Prompts und Videos bringt die Text-zu-Video-Technologie voran.
― 7 min Lesedauer
Lern, wie Salienz-Karten die Bild- und Videoerstellung verbessern.
― 5 min Lesedauer
SV3D erstellt atemberaubende 3D-Visualisierungen aus einzelnen 2D-Bildern.
― 6 min Lesedauer
Erstell ganz einfach sprechende Avatar-Videos mit Virbos innovativem System.
― 7 min Lesedauer
Ein neues Modell verbessert die Tiefenschätzung, indem es Vorhersagen und Mehrfachanalyse kombiniert.
― 5 min Lesedauer
Forscher erstellen einen Datensatz, um zu untersuchen, wie Menschen lernen, indem sie andere nachahmen.
― 8 min Lesedauer
Ein neuer KI-Ansatz zielt darauf ab, die Geschwindigkeit und Effizienz bei der Erstellung von Bildern und Videos zu verbessern.
― 5 min Lesedauer
Diese Studie zeigt, wie Medien Falschinformationen im Internet anheizen.
― 5 min Lesedauer
Ein neues System vereinfacht das Video-Editing durch automatisierte Beschreibungen.
― 6 min Lesedauer
ExoDeepFinder erkennt effizient seltene Exozytose-Ereignisse in Videodaten mithilfe von Deep Learning.
― 4 min Lesedauer
Diese Studie untersucht Audio-Methoden zur Verfolgung von Fussgängerbewegungen in städtischen Gebieten.
― 8 min Lesedauer
GenMM verbessert die realistische Einfügung von 3D-Objekten in Videos und LiDAR-Scans.
― 7 min Lesedauer
Wie TikTok die Gewohnheiten der Nutzer in Bezug auf Dampfen und Trinken prägt.
― 5 min Lesedauer
Dieser Artikel stellt eine Methode vor, um präzisen Sound aus Videos und Text zu erzeugen.
― 7 min Lesedauer
Diese Studie schlägt einen videobasierten Ansatz vor, um die Schwere von Autismus bei Kindern zu bewerten.
― 6 min Lesedauer
Ein umfangreicher Datensatz zur Verbesserung von Gebärdensprache-Technologie und Forschung.
― 5 min Lesedauer
Neuer Ansatz erzeugt hochwertige Videos von menschlichen Aktionen mit Tiefeninformationen.
― 8 min Lesedauer
Forscher entwickeln PAV für realistische digitale Avatare aus Video-Clips.
― 5 min Lesedauer
Ein neuer Massstab verbessert das Verständnis von Modellen für lange Videos und Sprache.
― 5 min Lesedauer
Ein neuer Datensatz mit Bildpaaren von drei Kameratypen für die Forschung im Bereich Computer Vision.
― 6 min Lesedauer
Ein neuer Ansatz kombiniert Audio-, Video- und Textdaten für eine effektive Diagnostik von Depressionen.
― 8 min Lesedauer
Neuer Datensatz gibt Einblicke in Hassrede über Sprachen und Formate hinweg.
― 6 min Lesedauer
Dieses Framework kombiniert Videos und Hirndaten für eine bessere Schmerzbewertung.
― 6 min Lesedauer
SAM-2 verbessert die Analyse von chirurgischen Videos und meistert Herausforderungen wie Rauch und schwaches Licht.
― 5 min Lesedauer
VidGen-1M verbessert die Videogenerierung aus Text mit hochwertigen Daten.
― 5 min Lesedauer
Ein neuer Ansatz konzentriert sich auf subtile Inkonsistenzen bei der Erkennung von Deepfakes.
― 6 min Lesedauer
Ein Software-Tool, um die Bewegungen und den Raumgebrauch von Kühen zu verfolgen und zu analysieren.
― 7 min Lesedauer
RoboMNIST hilft Robotern, verschiedene Aktivitäten mit WiFi, Video und Audio zu erkennen.
― 6 min Lesedauer
Kangaroo verbessert die Videoanalyse, indem es visuelle Elemente, Sounds und Text effektiv integriert.
― 5 min Lesedauer
Eine neue Methode verbessert die Genauigkeit bei der Verfolgung von menschlicher Bewegung aus Videos.
― 5 min Lesedauer
Eine Studie zeigt einen neuen Weg, um Emotionen mit Video, Sound und Text zu identifizieren.
― 5 min Lesedauer
Neues Modell verbessert die Echtzeit-Spracherekennung und Effizienz in der Kommunikation.
― 5 min Lesedauer
Neue Methoden verbessern die Audio-Synchronisation bei wechselnden Videoszenen.
― 4 min Lesedauer
In diesem Artikel geht's darum, wie Roboter Kochkünste mithilfe von Infos aus dem Internet lernen.
― 7 min Lesedauer
Ein neues Modell erstellt Audio, das zum Video passt und verbessert so das Medienerlebnis.
― 5 min Lesedauer
Das MultiClimate-Dataset zeigt die öffentlichen Meinungen zum Klimawandel durch Videos.
― 6 min Lesedauer
Neue Methode hilft Robotern, Aufgaben zu lernen, indem sie menschliche Demonstrationen beobachten.
― 5 min Lesedauer
Eine Studie zeigt, dass Nudges bei Überschriften funktionieren, aber nicht bei niedlichen Deepfake-Videos.
― 6 min Lesedauer
Diese Studie untersucht, wie Audio, Video und Text zusammen in der Spracherkennung funktionieren.
― 7 min Lesedauer
Ändere, wie du Videos siehst, mit der innovativen Winkelverschiebungstechnologie von ReCapture.
― 6 min Lesedauer