Ein neues Framework vereinfacht die Animation von Bildern mit Klicks und kurzen Eingaben.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues Framework vereinfacht die Animation von Bildern mit Klicks und kurzen Eingaben.
― 8 min Lesedauer
Wir stellen REPAIR vor, um die Genauigkeit der Datenpaarung in lauten Umgebungen zu verbessern.
― 6 min Lesedauer
Eine neue Methode verbessert die Kategorisierung, indem sie visuelle und textliche Informationen kombiniert.
― 7 min Lesedauer
ProMark bietet ein Verfahren, um erzeugte Bilder ihren ursprünglichen Quellen zuzuordnen.
― 5 min Lesedauer
Roboter lernen, sich in dynamischen Umgebungen effektiv bewegende Objekte zu suchen.
― 8 min Lesedauer
HandFormer verbessert die Aktionskennung mit 3D-Handposen und Bildern.
― 6 min Lesedauer
Mamba zeigt im Vergleich zu Transformern ein starkes Potenzial in der Videoanalyse.
― 6 min Lesedauer
Eine neue Methode verbessert die Ausrichtung von 3D-Körpermodellen auf 2D-Bilder.
― 5 min Lesedauer
Ein neuer Text-Encoder geht die Herausforderungen beim visuellen Text-Rendering an.
― 4 min Lesedauer
PosSAM verbessert die Bildsegmentierung mit offenen Vokabeln und innovativen Techniken.
― 6 min Lesedauer
Eine neue Methode verbessert die Genauigkeit von Namen in Bildsegmentierungs-Datensätzen.
― 7 min Lesedauer
Eine neue Methode verbessert die Sicherheitsfunktionen in multimodalen KI-Systemen, ohne dass man viel trainieren muss.
― 6 min Lesedauer
SkateFormer verbessert die menschliche Handlungsanerkennung durch fortschrittliche Gelenkanalyse und Aufmerksamkeits-Techniken.
― 7 min Lesedauer
Untersuchung, wie Striche in Skizzen die Entscheidungen von KI beeinflussen.
― 5 min Lesedauer
Ein neues Bayes'sches Framework verbessert die Bildqualität und schätzt Unsicherheiten.
― 6 min Lesedauer
Eine Methode zur Bewertung der Übertragbarkeit von vortrainierten Modellen für die Objekterkennung.
― 4 min Lesedauer
Eine neue Methode trennt bewegliche und statische Elemente in Stadtumgebungen.
― 8 min Lesedauer
RAIN-GS verbessert die 3DGS-Leistung mit besseren Initialisierungs- und Filtertechnik.
― 7 min Lesedauer
AVIBench testet LVLMs, um sicherzustellen, dass sie gegen feindliche visuelle Anweisungen bestehen.
― 8 min Lesedauer
SELECTOR nutzt verschiedene Daten, um die Überlebenschancen von Krebspatienten genau vorherzusagen.
― 8 min Lesedauer
Switch-DiT verbessert die Bildgenerierung durch innovative Beziehungen zwischen Entrauschungsaufgaben.
― 6 min Lesedauer
Dieser Artikel behandelt Methoden, um die Widerstandsfähigkeit des Deep Learnings gegenüber adversarialen Beispielen zu verbessern.
― 7 min Lesedauer
Verbesserung der Robustheit gegenüber adversarialen Angriffen in Vision-Language-Modellen.
― 5 min Lesedauer
Eine neue Methode verbessert die Objekterkennung, indem sie Domainverschiebungen mit Aufmerksamkeitsmechanismen angeht.
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Formenrepräsentation in komplexen 3D-Daten.
― 6 min Lesedauer
Neue Techniken verbessern die CBCT-Bildqualität und -geschwindigkeit für bessere Ergebnisse bei Patienten.
― 6 min Lesedauer
Eine neue Methode verbessert das Matching zwischen Bildern von sichtbaren und Infrarotkameras.
― 6 min Lesedauer
Diese Studie verbessert die Erkennung von Gesichts-AUs mit synthetischen Daten für bessere Genauigkeit und Fairness.
― 5 min Lesedauer
Eine neue Methode verbessert realistische Menschenbilder, indem sie sich auf die Handgenerierung konzentriert.
― 7 min Lesedauer
Neue Wasserzeichenmethode stärkt den Schutz von Machine-Learning-Modellen gegen Diebstahl.
― 7 min Lesedauer
InterLUDE verbessert die Modellleistung mit beschrifteten und unbeschrifteten Daten.
― 7 min Lesedauer
PALM verbessert die Anpassungsfähigkeit von Computer Vision-Modellen in sich ändernden Umgebungen.
― 8 min Lesedauer
Eine Studie zur HDMap-Generierung mit SDMap-Vorwissen und deren Leistungsbewertung.
― 8 min Lesedauer
FeatUp verbessert die Bildmerkmalauflösung und steigert die Leistung bei Computer Vision Aufgaben.
― 6 min Lesedauer
Dieser Artikel bewertet die Robustheit von CLIP in verschiedenen Herausforderungen.
― 6 min Lesedauer
Ein neuer Ansatz reduziert Verzerrungen in Machine-Learning-Modellen mit Klassenungleichgewicht.
― 6 min Lesedauer
Eine Studie zeigt, wie die Schwierigkeit von Aufgaben das Training in Diffusionsmodellen beeinflusst.
― 8 min Lesedauer
SCILLA bietet eine neue Möglichkeit, detaillierte 3D-Stadtmodelle aus 2D-Bildern zu erstellen.
― 7 min Lesedauer
HawkEye verbessert Video-Text-Modelle, um längere Videos effektiv zu verarbeiten.
― 6 min Lesedauer
Eine neue Methode ermöglicht das Benennen von Objekten ohne vordefinierte Kategorien während des Tests.
― 8 min Lesedauer