Computerwissenschaften - Multimedia

RSS

Künstliche Intelligenz Der Aufstieg von generativer KI: Transformation der Content-Erstellung

Generative KI-Tools verändern die Art und Weise, wie wir Inhalte in verschiedenen Bereichen erstellen.

2025-12-06T19:41:06+00:00 ― 13 min Lesedauer

Neueste Artikel

Maschinelles Lernen Verbesserung von Federated Learning durch Prototypen

2025-12-06T07:18:30+00:00 ― 5 min Lesedauer

Mensch-Computer-Interaktion Vorbereitung deiner ACM-Publikation: Ein Leitfaden

2025-12-05T17:13:12+00:00 ― 5 min Lesedauer

Ton Kausaler Audio-Transformer: Fortschritte in der Soundklassifizierung

2025-12-05T16:37:50+00:00 ― 5 min Lesedauer

Multimedia Fortschritte in der Text-zu-Bild-Synthese mit FDGAN

2025-12-05T09:58:42+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Klassifizierung von Social Media-Inhalten durch Nutzerkommentare

2025-12-04T08:49:48+00:00 ― 6 min Lesedauer

Neueste Artikel

Bild- und Videoverarbeitung Eine neue Metrik für die Video-Streaming-Qualität

Dieses Mass verbessert die Echtzeit-Videoqualitätsbewertung für ein besseres Streaming-Erlebnis.

2025-12-03T20:54:20+00:00 ― 5 min Lesedauer

Ton Sprache und Musik durch Emotion verbinden

Ein neues System passt Musik an Sprache basierend auf Emotionen an, ohne Text zu brauchen.

2025-12-03T16:02:50+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche Modellierung visueller Redundanz für Multimedia-Systeme

Ein neuer Ansatz zur Verbesserung der Bildqualität und Kompressionseffizienz.

2025-12-03T12:48:30+00:00 ― 6 min Lesedauer

Multimedia Fortschritte in der kontinuierlichen Emotionserkennung

Eine Studie zur Verbesserung der Emotionserkennung durch mehrere Datenquellen.

2025-12-03T11:11:20+00:00 ― 6 min Lesedauer

Bild- und Videoverarbeitung Fortschritte bei der Bildqualitätsbewertung von Lichtfeldern

Neue Methoden zur Bewertung von Lichtfeldbildern ohne Referenzbilder erkunden.

2025-12-02T11:42:25+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Altiro3D vorstellen: 3D-Bilder einfach erstellen

altiro3D macht das Erstellen von 3D-Visualisierungen aus 2D-Bildern einfach und effektiv.

2025-12-02T05:13:00+00:00 ― 4 min Lesedauer

Bild- und Videoverarbeitung Fortschritte im verteilten tiefen Video-Coding

Eine neue Methode zur effizienten Videokompression mit Deep-Learning-Techniken.

2025-12-01T22:45:05+00:00 ― 7 min Lesedauer

Informationstheorie Die Basics der Video-Kompression

Lerne, wie Videokompression die Streaming-Qualität und -Effizienz verbessert.

2025-12-01T16:07:48+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fälschungen bekämpfen: Ein neuer Ansatz

Ein neues System verbessert die Erkennung von Fake News in Online-Kommunikationen.

2025-12-01T14:12:24+00:00 ― 5 min Lesedauer

Multimedia Vorstellung von AIOZ-GDANCE: Ein neuer Datensatz für Gruppentanz-Generierung

AIOZ-GDANCE fördert die Forschung zur Schaffung von Gruppentanzbewegungen basierend auf Musik.

2025-12-01T11:24:55+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Multimodaler Kleidungsdesigner: Ein neuer Ansatz für Modebilder

Ein System, das Modebilder aus Texten, Skizzen und Posen erstellt.

2025-12-01T09:12:12+00:00 ― 9 min Lesedauer

Computer Vision und Mustererkennung Fortschritte beim Lokalisieren von Geräuschen in Videos

Forschung verbessert die Fähigkeit von Maschinen, Objekte zu finden, die Geräusche in Videos machen.

2025-12-01T02:30:30+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Verbesserung von audio-visuellen Segmentierungstechniken

Neue Methoden zielen darauf ab, wie Modelle Klänge mit Bildern verbinden, zu verbessern.

2025-11-30T15:09:54+00:00 ― 7 min Lesedauer

Multimedia Eine einheitliche Methode zur Bewertung der Videoqualität

Vorstellung von XGC-VQA für eine effektive Videoqualitätsbewertung über verschiedene Inhaltsarten hinweg.

2025-11-30T10:18:50+00:00 ― 5 min Lesedauer

Netzwerke und Internet-Architektur Zuverlässige Datenübertragung für moderne Konnektivität

Eine neue Methode verbessert die Datenübertragung sogar bei instabilen Internetverbindungen.

2025-11-30T00:40:54+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Ein neues Framework für Musikannotationen

Dieser Artikel behandelt einen systematischen Ansatz zur Musikannotation.

2025-11-28T06:29:30+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Verstehen der Musiknoten-Ontologie

Ein strukturierter Ansatz zur Musikdarstellung und Aufführungsanalyse.

2025-11-28T05:40:55+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Bilder aus Geräuschen erstellen: Das Sound2Scene Modell

Neues Modell verwandelt Geräusche in klare Bilder und überbrückt audio-visuelle Informationen.

2025-11-28T03:15:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neue Methode zur Audio-Beschriftung mit begrenzten Daten

Ein neuartiger Ansatz, um Audiountertitel mit vortrainierten Sprachmodellen zu erstellen.

2025-11-28T02:26:35+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in Multi-View Hashing-Techniken

Neue Methode verbessert die Multimedia-Suche, indem sie verschiedene Datentypen effektiv kombiniert.

2025-11-27T17:46:36+00:00 ― 5 min Lesedauer

Multimedia Essen Bilder mit Rezepten aus verschiedenen Küchen verbinden

Eine neue Methode verbindet Food-Bilder und Rezepte aus verschiedenen Küchen.

2025-11-27T14:05:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Objekterkennung in kodierten Videos

Eine Methode zur Verbesserung der Genauigkeit der Objekterkennung in Videos mit fortschrittlichen Verarbeitungstechniken.

2025-11-26T22:54:45+00:00 ― 5 min Lesedauer

Mensch-Computer-Interaktion Wir stellen vor: Promptify – Eine neue Art, Bildaufforderungen zu erstellen

Promptify vereinfacht den Prozess, um Eingabeaufforderungen für Text-zu-Bild-Modelle zu erstellen.

2025-11-26T09:39:00+00:00 ― 7 min Lesedauer

Multimedia Sichere digitale Vermögenswerte mit einem neuen NFT-Marktplatz

Eine dezentrale App zum sicheren Verwalten und Handeln von NFTs.

2025-11-25T15:20:54+00:00 ― 6 min Lesedauer

Multimedia Vorhersagen von Filmerfolg mit Data Science

Selbstüberwachtes Lernen nutzen, um die Kinoeinspielergebnisse vorherzusagen.

2025-11-25T10:04:54+00:00 ― 6 min Lesedauer

Multimedia Neues Modell verbessert die Bewertung der Videoqualität

Ein neuer Ansatz verbessert die Videoqualitätsvorhersagen nach dem Transcoding.

2025-11-25T09:25:24+00:00 ― 4 min Lesedauer

Mensch-Computer-Interaktion Die Auswirkungen von Multimedia auf Lernpräferenzen

Diese Studie untersucht, wie Multimedia das Verständnis für Anfänger und Experten verbessert.

2025-11-24T17:05:48+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Steganografie mit neuronalen Netzen verbessern

Ein neuer Ansatz kombiniert neuronale Netze mit Steganografie für besseres Verstecken von Daten.

2025-11-24T14:12:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Colorierungs-Techniken mit Textdaten

Eine neue Methode nutzt Text, um die Genauigkeit der Farbausmalung von Bildern zu verbessern.

2025-11-24T08:24:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fesselnde Titel und Cover für kurze Videos

Lern, wie man ansprechende Titel erstellt und Cover für deine Videos auswählt.

2025-11-23T20:33:24+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Integration von externem Wissen mit Vision-Language-Modellen

Ein neues Modell verbessert das Verständnis von Bildern und Texten mit externem Wissen.

2025-11-23T18:11:12+00:00 ― 5 min Lesedauer

Ton AffectMachine-Klassisch: Eine neue Art, emotionale Musik zu erstellen

AffectMachine-Classical erzeugt in Echtzeit klassische Musik, um bei der Emotionsbewältigung zu helfen.

2025-11-23T06:39:10+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Bekämpfung von Fehlinformationen mit neuen Techniken

Forscher entwickeln Methoden, um multimodale Fehlinformationen effektiv zu bekämpfen.

2025-11-23T02:39:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Live-Video-Kommentar-Generierung

Ein neues Modell verbessert das Zuschauerengagement mit automatisierten Filmkommentaren.

2025-11-22T16:14:54+00:00 ― 6 min Lesedauer

Multimedia Verbesserung der Video-Streaming-Effizienz mit szenenbasierten Bitratanpassungen

Ein neuer Ansatz, um die Videoqualität zu optimieren und den Datenverbrauch zu reduzieren.

2025-11-22T12:17:54+00:00 ― 4 min Lesedauer

Ton Audiovisuelles Lernen mit synchronisierten Filmen verbessern

Forschung nutzt synchronisierte Filme, um die Verbindung zwischen Sehen und Hören im maschinellen Lernen zu verbessern.

2025-11-22T07:58:50+00:00 ― 6 min Lesedauer

Multimedia Multimodale neuronale Datenbanken: Ein neuer Ansatz für Multimedia-Abfragen

Innovatives System verbessert die Sucheffizienz bei verschiedenen Datentypen.

2025-11-21T23:00:00+00:00 ― 9 min Lesedauer

Bild- und Videoverarbeitung Bildkompression mit Wahrnehmung kombinieren

Ein neues Modell kombiniert Bildkompression und Maschinenwahrnehmung für bessere Effizienz.

2025-11-21T19:50:05+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Innovative Gesichtsanonymisierung mit GANonymisierung

Neue Methode bewahrt Emotionen und anonymisiert Gesichter für besseren Datenschutz.

2025-11-21T13:15:24+00:00 ― 8 min Lesedauer

Multimedia Standardisierung von Qualitätsbewertungsdatensätzen

Eine neue Vorlage soll die Dokumentation von Datensätzen zur Bewertung der Multimedia-Qualität verbessern.

2025-11-21T07:43:36+00:00 ― 7 min Lesedauer