Computerwissenschaften - Multimedia

RSS

Computer Vision und Mustererkennung V-AURA: Fortschrittliche Video-zu-Audio-Integration

Ein neues Modell erstellt Audio, das zum Video passt und verbessert so das Medienerlebnis.

2025-06-05T23:59:05+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritt im Video-Sprachverständnis mit DataFlywheel

Ein neues Framework verbessert die Qualität von Video-Sprach-Datensätzen durch iterative Verfeinerung.

2025-06-03T23:12:48+00:00 ― 5 min Lesedauer

Multimedia Ein neues System für die Echtzeit-Sprach- und Gestenproduktion

Dieses Framework verbessert Echtzeit-Animationen, indem es Sprache und Gesten nahtlos synchronisiert.

2025-06-03T15:18:15+00:00 ― 5 min Lesedauer

Multimedia Die Auswirkungen von haptischem Feedback auf virtuelle Realität

Entdecke, wie haptisches Feedback virtuelle Erlebnisse in verschiedenen Branchen verbessert.

2025-06-03T00:34:00+00:00 ― 4 min Lesedauer

Multimedia Neue Technik hilft, Demenz-Aggression zu überwachen

Forschung kombiniert KI und tragbare Geräte, um Unruhe bei Demenzpatienten vorherzusagen.

2025-06-02T16:00:30+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Kreativität und Präzision in KI-Modellen vereinen

Eine neue Strategie kombiniert generatives und diskriminatives Training in Vision-Language-Modellen.

2025-06-02T08:06:30+00:00 ― 5 min Lesedauer

Multimedia Bewertung der Nutzererfahrung beim Live-Streaming

In diesem Artikel geht's darum, wie man die Zufriedenheit der Zuschauer beim Live-Streaming von Videos misst.

2025-06-01T09:03:10+00:00 ― 8 min Lesedauer

Maschinelles Lernen Fortschritte in der Audio-Video-Generierungstechniken

Eine neue Methode vereinfacht die Erstellung von Audio und Video für bessere Synchronisation.

2025-06-01T08:14:35+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im visuellen Objekt-Tracking mit PiVOT

PiVOT verbessert das Objekttracking mit visuellen Eingaben und CLIP für genauere Ergebnisse.

2025-06-01T01:45:55+00:00 ― 5 min Lesedauer

Bild- und Videoverarbeitung Optimierung der Video-Streaming-Qualität und Effizienz

Neue Methoden verbessern das Video-Streaming, indem sie Qualität und Leistung ausbalancieren.

2025-05-31T20:05:50+00:00 ― 5 min Lesedauer

Ton Fortschrittliche Multi-Audio-Verarbeitung mit MALLM

Ein neues Modell und Benchmark zur Bewertung von Multi-Audio-Aufgaben vorstellen.

2025-05-31T19:17:15+00:00 ― 6 min Lesedauer

Robotik Roboter-Navigation mit WildFusion verbessern

WildFusion verbessert die Kartierung und Navigation von Robotern in komplexen Aussenbereichen mithilfe mehrerer Sensoren.

2025-05-31T03:15:01+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Innovative Bildkompression für schnelleres Teilen

Eine neue Methode verbessert die Geschwindigkeit und Qualität der Bildkompression.

2025-05-30T23:38:51+00:00 ― 5 min Lesedauer

Ton Integration von Audio-Visuellen Daten für Sprachverarbeitung

Diese Studie untersucht, wie Audio, Video und Text zusammen in der Spracherkennung funktionieren.

2025-05-30T15:13:22+00:00 ― 7 min Lesedauer

Multimedia Multimedia-Qualität mit CCI bewerten

Entdecke, wie CCI die Qualitätseinschätzungen von Multimedia verbessert.

2025-05-29T12:29:42+00:00 ― 7 min Lesedauer

Multimedia Das neue Zeitalter der Lügendetektion

Forscher kombinieren Audio- und visuelle Hinweise, um Lügen genauer zu erkennen.

2025-05-29T11:09:31+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Erkennung von Datenkontamination in multimodalen Modellen

Ein neues Framework erkennt, wann multimodale Modelle ungeeignete Trainingsdaten verwenden.

2025-05-29T07:11:33+00:00 ― 5 min Lesedauer

Multimedia Verbinden durch unsere Sinne: Ein Blick auf die sensorische Wahrnehmung

Entdeck, wie sensorische Wahrnehmung die Kommunikation über Kulturen und Fachgebiete hinweg verbessert.

2025-05-27T06:41:24+00:00 ― 7 min Lesedauer

Ton Einführung von PIAST: Ein neuer Datensatz für die Forschung zu Klaviermusik

PIAST bietet eine einzigartige Sammlung von Klaviermusik für Forscher.

2025-05-26T01:38:20+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche Technologie mit 3D Audio-Visueller Segmentierung

Maschinen lernen, Geräusche und Bilder in 3D-Räumen zu verbinden.

2025-05-25T21:37:47+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Suchmaschinen mit Text und Bildern verbessern

Ein neuer Ansatz, um Bilder und Texte für bessere Suchergebnisse zu kombinieren.

2025-05-25T09:13:57+00:00 ― 5 min Lesedauer

Ton Zielsprecher-Extraktion: Klarheit in lauten Umgebungen verbessern

Erfahre, wie TSE die Spracherkennung in lauten Umgebungen mit Text-Hinweisen verbessert.

2025-05-25T00:14:51+00:00 ― 6 min Lesedauer

Ton Der Konkatenator: Eine neue Art, Musik zu machen

Ein frisches System zum Mischen von Audio-Proben, um Musikschaffenden das Innovieren zu erleichtern.

2025-05-24T05:32:17+00:00 ― 6 min Lesedauer

Ton Dynamische Musikgenerierung für Tabletop-RPGs

Ein System erstellt in Echtzeit Musik basierend auf Erzählungen von Tischrollenspielen.

2025-05-23T16:10:27+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Deepfakes: Die Herausforderung, Realität zu erkennen

Mit dem Anstieg von Deepfakes wird die Notwendigkeit für effektive Erkennung immer wichtiger.

2025-05-23T05:01:57+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung TaylorIR: Ein neuer Ansatz für Bildsuperauflösung

TaylorIR verbessert die Bildklarheit mit weniger Rechenleistung.

2025-05-22T10:58:48+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung MTFusion: Ein neuer Ansatz für 3D-Modellierung

MTFusion kombiniert Bilder und Texte für die fortschrittliche Erstellung von 3D-Modellen.

2025-05-20T18:44:33+00:00 ― 6 min Lesedauer

Ton Audio mit Notenblatt synchronisieren: Ein neuer Ansatz

Kombiniere Audioaufnahmen mit Noten für besseres Üben.

2025-05-20T17:20:44+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Bildvergrösserungstechniken

Neue Methoden verbessern die Bildqualität und Auflösung erheblich.

2025-05-20T15:41:51+00:00 ― 8 min Lesedauer

Kryptographie und Sicherheit Kreativität im Zeitalter der Diffusionsmodelle schützen

Lern, wie neue Wasserzeichen-Techniken digitale Kunst und kreative Ideen schützen.

2025-05-20T02:25:20+00:00 ― 6 min Lesedauer

Ton Visuelle Hinweise nutzen, um Sprache im Lärm klarer zu machen

Neue Methode verbessert die Sprachverständlichkeit durch visuelle Informationen aus der Umgebung.

2025-05-18T20:42:14+00:00 ― 5 min Lesedauer

Multimedia TopoCode: Ein neuer Ansatz zur Fehlerkorrektur

TopoCode verbessert die Kommunikation, indem es sich auf die Datenstruktur zur Fehlererkennung konzentriert.

2025-05-18T15:22:40+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Der Aufstieg von Deepfakes und ihre Auswirkungen

Die Herausforderungen und Auswirkungen von Deepfake-Technologie in der heutigen Medienlandschaft erkunden.

2025-05-18T12:54:56+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Video-Bearbeitung mit Sprachbefehlen einfacher machen

Bearbeite Videos mühelos, indem du einfach deine Änderungen sprichst.

2025-05-17T16:34:40+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Giessende Wissenschaft: Die Geräusche von Flüssigkeiten

Entdecke die faszinierende Wissenschaft hinter den Geräuschen des Einschenkens von Getränken.

2025-05-11T17:21:38+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Tiefe Schätzung mit PriorDiffusion vorantreiben

Sprache und visuelle Elemente kombinieren für eine bessere Tiefenwahrnehmung.

2025-05-10T21:10:40+00:00 ― 6 min Lesedauer

Ton Die Zukunft der Audio-Kompression und HOA

Entdecke innovative Methoden zur Audiokompression und ihren Einfluss auf immersiven Sound.

2025-05-10T02:25:08+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Videogenerierung mit ConsisID

Eine neue Methode zum Erstellen von Videos, die die Identität bewahren und die visuelle Qualität verbessern.

2025-05-06T09:30:40+00:00 ― 6 min Lesedauer

Ton HARP: Eine neue Ära im räumlichen Audio

Das HARP-Dataset verändert, wie wir Klang in virtuellen Umgebungen erleben.

2025-05-04T06:13:44+00:00 ― 6 min Lesedauer

Multimedia Die Entwicklung der Bildqualitätsbewertung

Entdecke, wie Technologie die Verfahren zur Bewertung der Bildqualität verändert.

2025-05-04T04:44:00+00:00 ― 9 min Lesedauer