Computerwissenschaften - Multimedia

Computer Vision und Mustererkennung NU-Class Net: Verbesserung der Videoqualität nach der Kompression

Ein neues Modell verbessert Videos von niedriger Qualität und verringert gleichzeitig die Verarbeitungsanforderungen.

2025-09-19T05:25:42+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Eine neue Methode zur Bewertung von Bild- und Videoqualität

SAMA verbessert die Qualitätsbewertung von Bildern und Videos durch effektive Sampling-Techniken.

2025-09-19T00:33:24+00:00 ― 5 min Lesedauer

Informationsbeschaffung Herausforderungen beim Lernen aus Musikvideos

Diese Studie untersucht die Schwierigkeiten bei der Verwendung von kontrastivem Lernen für das Verständnis von Musikvideos.

2025-09-18T17:21:45+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Die Revolution der Charakteraugen in der Animation

Eine neue Methode vereinfacht das Design von animierten Charakteraugen.

2025-09-18T14:01:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Bildkompression mit Frequenzanalyse vorantreiben

Eine neue Methode verbessert die Bildkompression, indem sie sich auf Frequenzbänder konzentriert.

2025-09-16T14:45:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Vlogger: Ein neues Tool zur Videoerstellung

Vlogger macht Video-Blogging einfacher und schneller für Creator.

2025-09-16T11:12:00+00:00 ― 6 min Lesedauer

Multimedia Die Umweltauswirkungen von Video-Streaming

Untersuchung des Energieverbrauchs und der Auswirkungen des Video-Streamings auf die Umwelt.

2025-09-16T01:59:00+00:00 ― 6 min Lesedauer

Ton Neues Modell verbessert die Bewertung der Fischnahrungsaufnahme

Ein einheitlicher Ansatz zur Bewertung der Fischfütterung mit Audio- und Videodaten.

2025-09-14T21:03:15+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Die Auswirkungen von KI auf Videotechnologie

Entdeck, wie KI die Videoerstellung und das Streaming verändert.

2025-09-13T11:18:36+00:00 ― 5 min Lesedauer

Bild- und Videoverarbeitung Vorstellung des Video Conferencing Datasets für die reale Kommunikation

Ein Datensatz, der speziell für den Test der Videoqualität in Konferenzsituationen gemacht ist.

2025-09-13T03:45:30+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Neuer Rahmen verbindet Video und Text effektiver

Forscher entwickeln ein Rahmenwerk für besseres Verständnis von Videos und Texten.

2025-09-12T20:49:36+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Audio-Visuellen Segmentierungstechniken

Eine neue Methode verbessert die audio-visuelle Segmentierung ohne detaillierte Labels.

2025-09-12T20:28:15+00:00 ― 6 min Lesedauer

Ton Neues System verbessert Sprachausgabe bei instabilen Kopfpositionen

PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.

2025-09-12T19:39:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung MusiLingo: Musik und Sprache verbinden

Ein neues System, das Musik und Sprache verbindet für ein besseres Verständnis.

2025-09-11T14:30:40+00:00 ― 6 min Lesedauer

Multimedia Effektives Plakatdesign durch einfache Kennzahlen

Lerne, wie man Poster gestaltet, die Nachrichten klar und ansprechend rüberbringen.

2025-09-09T08:49:24+00:00 ― 5 min Lesedauer

Multimedia BDIQA: Verbesserung der Video-Fragenbeantwortung mit Theory of Mind

Ein neuer Datensatz verbessert die Fähigkeit von KI, menschliches Verhalten in Videos zu interpretieren.

2025-09-09T07:30:24+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion Spica: Ein neues Tool für blinde Nutzer

Spica verbessert den Videozugang für blinde und sehbehinderte Nutzer durch Interaktivität.

2025-09-09T06:43:00+00:00 ― 5 min Lesedauer

Robotik Roboter auf unerwartete Herausforderungen testen

Methoden erkunden, um die Leistung von Robotern in unvorhersehbaren Umgebungen zu verbessern.

2025-09-09T02:53:54+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachkonversionstechnologie mit Gesichtsabbildungen

Neue Methode verwandelt Stimmen mithilfe von Gesichtszügen für verschiedene Anwendungen.

2025-09-09T01:46:55+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Vorhang auf für AV-SUPERB: Ein neuer Massstab für Audio-Visuelle Modelle

AV-SUPERB bewertet Audio- und visuelle Modelle über verschiedene Aufgaben hinweg für eine bessere Leistung.

2025-09-08T22:32:35+00:00 ― 6 min Lesedauer

Informationsbeschaffung Verbesserung der Videosuche mit modernen Techniken

Eine neue Methode vereinfacht die Videosuche, indem sie verschiedene Informationsarten kombiniert.

2025-09-08T20:50:30+00:00 ― 6 min Lesedauer

Multimedia Emotionsempfindliche Maschinen für bessere Interaktionen entwickeln

Maschinen entwickeln, die basierend auf Emotionen reagieren, um die Interaktion zwischen Mensch und Computer zu verbessern.

2025-09-08T19:31:30+00:00 ― 6 min Lesedauer

Ton Schnellere Text-zu-Audio-Generierung durch Konsistenz-Destillation

Neue Methode verbessert Geschwindigkeit und Effizienz bei der Text-zu-Audio-Generierung.

2025-09-08T18:29:40+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Techniken zur Schallquellenlokalisierung

Die Art und Weise, wie wir Schallquellen mit audio-visuellen Daten identifizieren, zu verbessern.

2025-09-08T12:49:35+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Geräuschkarten: Ein neuer Ansatz zur Analyse von Klanglandschaften

Eine Methode, um Geräusche in verschiedenen Umgebungen mit fortschrittlicher Technik zu visualisieren und vorherzusagen.

2025-09-08T11:12:25+00:00 ― 6 min Lesedauer

Multimedia Green-LL: Verbesserung des Live-Videostreaming-Erlebnisses

Ein neuer Ansatz, um die Qualität und Energieeffizienz von mobilen Live-Video-Streams zu verbessern.

2025-09-08T06:13:36+00:00 ― 8 min Lesedauer

Informationsbeschaffung Personalisierte Essensempfehlungen mit ChatDiet

ChatDiet kombiniert persönliche Daten und Bevölkerungswissen für bessere Ernährungstipps.

2025-09-07T00:28:12+00:00 ― 9 min Lesedauer

Multimedia Fernsehdebatten: Ein genauerer Blick auf Vorurteile und Höflichkeit

Eine Analyse von Voreingenommenheit und Unhöflichkeit in indischen Fernsehdiskussionen.

2025-09-06T18:16:54+00:00 ― 6 min Lesedauer

Bild- und Videoverarbeitung Fortschritte bei Videokompressionstechniken

Neues Framework verbessert die Effizienz und Qualität der Video-Kompression.

2025-09-06T14:40:20+00:00 ― 6 min Lesedauer

Mensch-Computer-Interaktion Die Rolle von visuellem Medium in der Propaganda

Dieser Artikel untersucht, wie Bilder die öffentliche Meinung während des Russland-Ukraine-Konflikts beeinflusst haben.

2025-09-05T06:04:24+00:00 ― 4 min Lesedauer

Bild- und Videoverarbeitung Verbesserung der drahtlosen Bildübertragung in lauten Umgebungen

Ein neues Verfahren verbessert die Bildqualität bei der drahtlosen Übertragung über rauschende Kanäle.

2025-09-05T03:18:04+00:00 ― 5 min Lesedauer

Computer und Gesellschaft MemeCraft: Ein neues Tool für soziale Advocacy

MemeCraft erstellt coole Memes, um soziale Anliegen sicher zu fördern.

2025-09-04T14:48:00+00:00 ― 11 min Lesedauer

Computer Vision und Mustererkennung Verbesserung des audio-visuellen Lernens mit Speed Co-Augmentation

Eine neue Methode verbessert das maschinelle Lernen von audio-visuellen Daten.

2025-09-04T05:59:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache RVS Aufgabe: Ein neuer Blick auf Wegbeschreibungen

Forschung zeigt, dass es mehrere Möglichkeiten gibt, Anweisungen mit räumlichem Wissen zu geben.

2025-09-03T23:39:30+00:00 ― 8 min Lesedauer

Signalverarbeitung Ein neuer Ansatz zur Identifizierung von Schizophrenie-Symptomen

Kombination aus Audio, Video und Text für bessere psychische Gesundheitsbewertungen.

2025-09-03T22:42:15+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Technologie zur Generierung sprechender Gesichter

Neues Framework verbessert die Lippen-Synchronisation und die visuelle Qualität in Videos mit sprechenden Gesichtern.

2025-09-03T04:02:24+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Fehlererkennung mit synthetischen Beispielen

Eine neue Methode erzeugt gefälschte fehlerhafte Proben, um die Anomalieerkennung in der Fertigung zu verbessern.

2025-09-02T21:51:06+00:00 ― 6 min Lesedauer

Ton Stimme und Gesicht kombinieren für bessere Identifikation

Neue Methode verbessert die Sprecherverifikation, indem sie Audio- und Visuelle Daten kombiniert.

2025-09-02T07:50:15+00:00 ― 5 min Lesedauer

Multimedia Fortschritte in der Audio-Visual Lautsprecherlokalisierung

Eine neue Methode verbessert das Verfolgen von Sprechern mit Audio- und Videodaten.

2025-09-02T06:13:05+00:00 ― 7 min Lesedauer

Ton Ein neues Modell zur Musikgenerierung mit KI

MusicAOG vereinfacht die Musikproduktion und das Verständnis durch eine innovative grafische Darstellung.

2025-08-31T08:52:25+00:00 ― 7 min Lesedauer