Ein System, um die Fernsteuerung von UAVs sicherer und zuverlässiger zu machen, indem ein Digital Twin genutzt wird.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein System, um die Fernsteuerung von UAVs sicherer und zuverlässiger zu machen, indem ein Digital Twin genutzt wird.
― 7 min Lesedauer
Ein neues Framework identifiziert und misst Vorurteile in Bildgenerierungssystemen.
― 8 min Lesedauer
Erforsche, wie Diffusionsmodelle die Superauflösung in verschiedenen Bereichen verbessern.
― 6 min Lesedauer
Ein neues Modell verbessert Videos von niedriger Qualität und verringert gleichzeitig die Verarbeitungsanforderungen.
― 8 min Lesedauer
SAMA verbessert die Qualitätsbewertung von Bildern und Videos durch effektive Sampling-Techniken.
― 5 min Lesedauer
Diese Studie untersucht die Schwierigkeiten bei der Verwendung von kontrastivem Lernen für das Verständnis von Musikvideos.
― 6 min Lesedauer
Eine neue Methode vereinfacht das Design von animierten Charakteraugen.
― 7 min Lesedauer
Eine neue Methode verbessert die Bildkompression, indem sie sich auf Frequenzbänder konzentriert.
― 6 min Lesedauer
Vlogger macht Video-Blogging einfacher und schneller für Creator.
― 6 min Lesedauer
Untersuchung des Energieverbrauchs und der Auswirkungen des Video-Streamings auf die Umwelt.
― 6 min Lesedauer
Ein einheitlicher Ansatz zur Bewertung der Fischfütterung mit Audio- und Videodaten.
― 5 min Lesedauer
Entdeck, wie KI die Videoerstellung und das Streaming verändert.
― 5 min Lesedauer
Ein Datensatz, der speziell für den Test der Videoqualität in Konferenzsituationen gemacht ist.
― 6 min Lesedauer
Forscher entwickeln ein Rahmenwerk für besseres Verständnis von Videos und Texten.
― 6 min Lesedauer
Eine neue Methode verbessert die audio-visuelle Segmentierung ohne detaillierte Labels.
― 6 min Lesedauer
PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.
― 6 min Lesedauer
Ein neues System, das Musik und Sprache verbindet für ein besseres Verständnis.
― 6 min Lesedauer
Lerne, wie man Poster gestaltet, die Nachrichten klar und ansprechend rüberbringen.
― 5 min Lesedauer
Ein neuer Datensatz verbessert die Fähigkeit von KI, menschliches Verhalten in Videos zu interpretieren.
― 7 min Lesedauer
Spica verbessert den Videozugang für blinde und sehbehinderte Nutzer durch Interaktivität.
― 5 min Lesedauer
Methoden erkunden, um die Leistung von Robotern in unvorhersehbaren Umgebungen zu verbessern.
― 5 min Lesedauer
Neue Methode verwandelt Stimmen mithilfe von Gesichtszügen für verschiedene Anwendungen.
― 8 min Lesedauer
AV-SUPERB bewertet Audio- und visuelle Modelle über verschiedene Aufgaben hinweg für eine bessere Leistung.
― 6 min Lesedauer
Eine neue Methode vereinfacht die Videosuche, indem sie verschiedene Informationsarten kombiniert.
― 6 min Lesedauer
Maschinen entwickeln, die basierend auf Emotionen reagieren, um die Interaktion zwischen Mensch und Computer zu verbessern.
― 6 min Lesedauer
Neue Methode verbessert Geschwindigkeit und Effizienz bei der Text-zu-Audio-Generierung.
― 4 min Lesedauer
Die Art und Weise, wie wir Schallquellen mit audio-visuellen Daten identifizieren, zu verbessern.
― 7 min Lesedauer
Eine Methode, um Geräusche in verschiedenen Umgebungen mit fortschrittlicher Technik zu visualisieren und vorherzusagen.
― 6 min Lesedauer
Ein neuer Ansatz, um die Qualität und Energieeffizienz von mobilen Live-Video-Streams zu verbessern.
― 8 min Lesedauer
ChatDiet kombiniert persönliche Daten und Bevölkerungswissen für bessere Ernährungstipps.
― 9 min Lesedauer
Eine Analyse von Voreingenommenheit und Unhöflichkeit in indischen Fernsehdiskussionen.
― 6 min Lesedauer
Neues Framework verbessert die Effizienz und Qualität der Video-Kompression.
― 6 min Lesedauer
Dieser Artikel untersucht, wie Bilder die öffentliche Meinung während des Russland-Ukraine-Konflikts beeinflusst haben.
― 4 min Lesedauer
Ein neues Verfahren verbessert die Bildqualität bei der drahtlosen Übertragung über rauschende Kanäle.
― 5 min Lesedauer
MemeCraft erstellt coole Memes, um soziale Anliegen sicher zu fördern.
― 11 min Lesedauer
Eine neue Methode verbessert das maschinelle Lernen von audio-visuellen Daten.
― 6 min Lesedauer
Forschung zeigt, dass es mehrere Möglichkeiten gibt, Anweisungen mit räumlichem Wissen zu geben.
― 8 min Lesedauer
Kombination aus Audio, Video und Text für bessere psychische Gesundheitsbewertungen.
― 6 min Lesedauer
Neues Framework verbessert die Lippen-Synchronisation und die visuelle Qualität in Videos mit sprechenden Gesichtern.
― 5 min Lesedauer
Eine neue Methode erzeugt gefälschte fehlerhafte Proben, um die Anomalieerkennung in der Fertigung zu verbessern.
― 6 min Lesedauer