Computerwissenschaften - Multimedia

RSS

Computer Vision und Mustererkennung ElasticHash: Ein neuer Ansatz zur Bildähnlichkeitssuche

ElasticHash nutzt Deep Learning für schnelle und präzise Bildsuchen.

2025-11-19T07:55:54+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Text-zu-Bild ReID-Forschung

Ein neues Dataset verbessert die Genauigkeit bei der Text-zu-Bild-Zuordnung.

2025-11-19T03:58:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung StyleSync: Eine neue Art zu Lippen-Syncen

StyleSync verbessert die Lippen-Synchronisation für digitale Inhalte mit innovativen Techniken.

2025-11-18T19:49:06+00:00 ― 6 min Lesedauer

Ton Die Messung von Schönheit in der Musik: Ein neuer Ansatz

Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.

2025-11-18T07:37:25+00:00 ― 5 min Lesedauer

Multimedia Schlechte Infos in sozialen Medien aufdecken

Ein neues Modell kombiniert Logik und neuronale Netzwerke, um Fehlinformationen effektiver zu erkennen.

2025-11-18T04:01:06+00:00 ― 6 min Lesedauer

Computer und Gesellschaft Digitale Zwillinge im Metaversum: Eine neue Grenze

Die Integration von digitalen Zwillingen und dem Metaverse für bessere Erlebnisse erkunden.

2025-11-17T17:05:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache IMAGINATOR: Text und Bilder verbinden

Ein neues Tool, das Text und Bilder für verschiedene Aufgaben verbindet.

2025-11-17T16:41:42+00:00 ― 7 min Lesedauer

Bild- und Videoverarbeitung HDR vs. SDR: Die Sicht eines Zuschauers

Analyse der Videoqualität-Vorlieben zwischen HDR und SDR-Formaten.

2025-11-17T07:19:55+00:00 ― 5 min Lesedauer

Maschinelles Lernen Die Einfachheit von Polytopen in tiefen Netzwerken

Die Untersuchung der Formen von Polytopen zeigt interessante Einblicke in tiefe ReLU-Netzwerke.

2025-11-16T19:53:30+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Ein schnellerer Ansatz für Video-Fragenbeantwortung

Neue Methode kombiniert Video-Frames für effizientes Beantworten von Fragen.

2025-11-16T19:37:42+00:00 ― 4 min Lesedauer

Bild- und Videoverarbeitung Verstehen von HDR-VDP-3: Ein Leitfaden zur Bewertung der Bildqualität

Lern, wie HDR-VDP-3 die Bildqualitätsbewertung für verschiedene Anwendungen verbessert.

2025-11-16T08:39:35+00:00 ― 5 min Lesedauer

Multimedia Fortschritte in der multimodalen Sentimentanalyse

Neue Methoden verbessern die Sentiment-Analyse mit begrenzten gekennzeichneten Daten.

2025-11-15T10:26:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im Video-Frage-Antworten durch Spieltheorie

Ein neues Modell verbessert die Video-Frage-Antwort-Funktion mit Hilfe von Spieltheorie-Prinzipien.

2025-11-15T07:56:48+00:00 ― 6 min Lesedauer

Ton LORIS: Ein neuer Ansatz zur Video-Musik-Generierung

LORIS erzeugt hochwertige Musik, die perfekt mit den Bewegungen im Video synchronisiert ist.

2025-11-14T05:38:50+00:00 ― 6 min Lesedauer

Bild- und Videoverarbeitung GAMIVAL: Ein neues Tool für die Videoqualität von Spielen

GAMIVAL bewertet die Streaming-Qualität für mobiles Cloud-Gaming ohne Referenzvideos.

2025-11-13T21:33:00+00:00 ― 4 min Lesedauer

Multimedia Video-Charaktersuche mit SoCoSearch vorantreiben

SoCoSearch verbessert, wie wir Charaktere in Videoinhalten mithilfe von sozialem Kontext finden.

2025-11-13T14:20:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Desinformation mit FACTIFY 3M bekämpfen

Ein Datensatz, der darauf abzielt, das Faktenchecken zu verbessern, indem Text und Bilder kombiniert werden.

2025-11-13T10:55:00+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Integritätsverschlüsseler: Ein neuer Ansatz zur Erkennung von Deepfakes

Eine proaktive Methode, um Bilder vor Deepfake-Manipulationen zu schützen.

2025-11-12T20:18:06+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Methoden zur Bewertung der Videoqualität

Forschung verbessert die Bewertung der Videoqualität mit fortschrittlichen Methoden und umfassenden Datenbanken.

2025-11-12T17:32:12+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Der Aufstieg der Text-zu-Bild-Generierung

Dieser Artikel schaut sich den aktuellen Stand der Text-zu-Bild-Generierungstechnologie an.

2025-11-12T07:16:00+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Die Verbesserung der semantischen Segmentierung mit Tiefendaten

Eine neue Methode verbessert die Segmentierungsgenauigkeit, indem sie Tiefeninformationen ohne Quelldaten integriert.

2025-11-12T00:01:30+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Neues Framework verwandelt Videogenerierung aus Text

Eine neue Methode verbessert die Videoproduktion aus Text mit mehr Kontrolle und Qualität.

2025-11-11T16:15:24+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprach-zu-Gesang-Technologie

Forschung zeigt eine Methode, um gesprochene Wörter effizient in Gesang zu verwandeln.

2025-11-11T12:52:10+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im maschinellen Lernen mit integrierter multimodaler Wahrnehmung

Ein Blick darauf, wie integrierte multimodale Wahrnehmung die Fähigkeiten des maschinellen Lernens verbessert.

2025-11-10T19:51:55+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Sprachsynthese mit CoMoSpeech

CoMoSpeech verbessert die Sprachsynthese-Geschwindigkeit und -Qualität mit einem einfachen Schritt.

2025-11-10T05:17:25+00:00 ― 5 min Lesedauer

Mensch-Computer-Interaktion Hassangriffe in Live-Streaming-Communities angehen

Ein Blick auf Hate-Raids und ihren Einfluss auf marginalisierte Streamer.

2025-11-09T22:07:24+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche Bildkompression für menschliche Wahrnehmung

Eine neue Methode verbessert die Bildkompression, indem sie menschlich freundliche Merkmale priorisiert.

2025-11-09T19:34:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Memes im Kontext verstehen

Diese Studie hebt hervor, wie wichtig der Kontext beim Interpretieren von Memes ist.

2025-11-09T18:10:24+00:00 ― 6 min Lesedauer

Ton Innovative Ansätze zur Neugestaltung von Musik

Eine neue Methode, um einzigartige Musikversionen zu erstellen, indem vorhandene Stücke umsortiert werden.

2025-11-09T15:31:30+00:00 ― 7 min Lesedauer

Informationsbeschaffung Einführung des SURE-Datensatzes für Einkaufsdialoge

Ein Datensatz, der dazu dient, die Interaktionen zwischen Kunden und Verkäufern in Geschäften zu verbessern.

2025-11-09T10:24:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Ein neuer Ansatz für visuelles Fragenbeantworten

Ein modulares Verfahren für Zero-Shot visuelle Fragenbeantwortung vorstellen.

2025-11-08T19:07:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Aufgaben-Schritte mit Videoanalyse überarbeiten

Eine neue Methode, um die Arbeitsschritte mit Videoeinblicken besser zu organisieren.

2025-11-08T18:04:42+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Qualitätsmessung von Entunschärfung

Verbesserung der Metriken zur Bewertung von Entschärfungsmethoden mit einem neuen Datensatz.

2025-11-08T16:14:06+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Visuelle-Sprach-Modelle mit CLIP-Feedback verbessern

Eine neue Methode verbessert die Vision-Language-Modelle durch Echtzeit-Feedback für bessere Leistung.

2025-11-08T04:38:54+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei Modellen zur Erkennung von Fake News

Neue Modelle verbessern die Erkennung von Fake News mit verschiedenen Datentechniken.

2025-11-08T01:13:30+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Multi-Kamera-Systemen für autonome Fahrzeuge

Occ-BEV verbessert die Fahrzeugwahrnehmung durch Multi-Kamera 3D-Modellierung und Datenintegration.

2025-11-07T14:57:18+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Analyse der J-UNIWARD-Methode und ihrer Fehler

Ein Blick auf die Nachrichtverstecktechnik von J-UNIWARD und seinen kleinen Rechenfehler.

2025-11-06T17:05:54+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Vorurteile bei der visuellen Frage-Antwortung ansprechen

Ein neuer Ansatz bekämpft Sprach- und Sichtbiais in VQA-Systemen.

2025-11-06T14:27:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Kompressionsqualität von 3D-Punktwolken

Eine Methode zur Verbesserung von komprimierten 3D-Punktwolkendaten mithilfe fortschrittlicher neuronaler Netzwerke.

2025-11-06T06:33:54+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritt im multimodalen Lernen mit C-MCR

C-MCR vereinfacht das multimodale Lernen, indem es vorhandenes Wissen effizient verknüpft.

2025-11-05T03:49:55+00:00 ― 6 min Lesedauer