Ein neuer Massstab, um visuelle Sprachmodelle bei minimalen Änderungen in Bildern und Bildunterschriften zu testen.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neuer Massstab, um visuelle Sprachmodelle bei minimalen Änderungen in Bildern und Bildunterschriften zu testen.
― 7 min Lesedauer
UMAP nutzen, um Beschriftungsfehler in medizinischen Bilddatensätzen zu erkennen.
― 6 min Lesedauer
Fortschritte beim Erkennen von Daten, die ausserhalb der Verteilung liegen, mithilfe neuer Techniken.
― 6 min Lesedauer
Eine neue Methode verbessert die Bildsegmentierung mit SAM und anpassbaren Aufforderungen.
― 8 min Lesedauer
Untersuchung des kreativen Prozesses hinter der Produktion von Fake-News-Videos.
― 7 min Lesedauer
Die Verfolgung der Augenbewegungen mit Event Kameras verbessert das Verständnis der Augenbewegungen.
― 6 min Lesedauer
Eine neue Methode verbessert die Analyse medizinischer Bilder und schützt dabei die Privatsphäre der Patienten.
― 5 min Lesedauer
Eine neue Methode verbessert das Verständnis von 3D-Segmentierungsmodellen im Gesundheitswesen.
― 9 min Lesedauer
Dieser Artikel behandelt die Rolle von deformierbaren Faltungen zur Verbesserung der semantischen Segmentierung beim autonomen Fahren.
― 5 min Lesedauer
Forschung beschäftigt sich mit Vorurteilen, die das audio-visuelle Verständnis in der Technologie beeinflussen.
― 5 min Lesedauer
Untersuchen, wie die Zeitabstimmung von Sensordaten die Sicherheit und Leistung von autonomen Fahrzeugen beeinflusst.
― 6 min Lesedauer
QPT V2 verbessert die visuelle Bewertung mit maskierter Bildmodellierung und hochwertigen Daten.
― 6 min Lesedauer
Dynamisches Retraining-Update verbessert die Objekterkennung, ohne dass gelabelte Daten nötig sind.
― 6 min Lesedauer
MMTrail kombiniert visuelle und auditive Beschreibungen für bessere Video-Sprachmodelle.
― 5 min Lesedauer
Hämatoxylin- und Eosin-Färbung verbessert die Bewertung von Immunzellen in Tumoren.
― 5 min Lesedauer
Neue Methoden verbessern Machine-Learning-Modelle, um ungewöhnliche Stichproben in unausgewogenen Datensätzen besser zu erkennen.
― 7 min Lesedauer
Eine neue Methode verbessert die Erkennung kleiner Objekte und reduziert gleichzeitig den Ressourcenverbrauch.
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit von 3D-Modellen aus Mehransichtenbildern.
― 5 min Lesedauer
Ein Leitfaden zum Umgang mit Unsicherheiten bei der medizinischen Bildsegmentierung für bessere Diagnosen.
― 5 min Lesedauer
TAPTRv2 verbessert das Punkt-Tracking in Videos mit Aufmerksamkeitsmechanismen für genauere Ergebnisse.
― 5 min Lesedauer
HyTAS vereinfacht die Suche nach Transformator-Modellen in der hyperspektralen Bildgebung.
― 8 min Lesedauer
Eine neue Methode, um die Integration von medizinischen Bildern und Berichten für bessere Analysen zu verbessern.
― 7 min Lesedauer
LawLuo kombiniert mehrere Agenten für ein besseres rechtliches Beratungserlebnis.
― 6 min Lesedauer
Ein neuer Ansatz zur Verbesserung des multimodalen Lernens mit fehlenden Daten.
― 6 min Lesedauer
Eine neue Methode verbessert die Altersschätzung mithilfe von Gesichtsmerkmalen und Graph-Neuronalen-Netzen.
― 9 min Lesedauer
Ein neues Verfahren zur Bewertung der 4K-Videoqualität ohne Referenzvideos.
― 6 min Lesedauer
Channel-Partitioned Attention Transformer verbessert die Bilddetails und Klarheit.
― 5 min Lesedauer
Dieser Artikel bespricht Methoden zur Schätzung der Position von Flugzeugen mithilfe von Bilddaten.
― 7 min Lesedauer
Fortgeschrittene Bildanalyse könnte die Behandlungswahl für Patientinnen mit Eierstockkrebs verbessern.
― 3 min Lesedauer
Eine neue Methode verbessert die AVQA-Leistung, wenn Audio- oder Videoeingaben fehlen.
― 5 min Lesedauer
Eine Methode, um Audio zu erstellen, das zu Videos aus der Ich-Perspektive passt.
― 8 min Lesedauer
Neue Methoden verbessern die Bildpersonalisierung, indem sie Diffusions- und StyleGAN-Modelle kombinieren.
― 5 min Lesedauer
Ein neues Framework verbessert die WSI-Klassifikation, indem es den räumlichen Kontext einbezieht.
― 6 min Lesedauer
Eine neue Methode verbessert das Lernen von visuellen Daten, ohne Details zu verlieren.
― 6 min Lesedauer
Eine Studie zur Verbesserung von CNNs mithilfe von teilweisen Labels und adversarialen Angriffsmodellen.
― 6 min Lesedauer
PEEKABOO hilft Maschinen, Objekte ohne beschriftete Daten durch Bildmaskierung zu finden.
― 5 min Lesedauer
Qualitativ hochwertige Bildannotationen sind entscheidend für den Erfolg von KI in der Bildanalyse.
― 4 min Lesedauer
Wir stellen einen flexiblen Ansatz vor, um realistische 3D-Städte zu erstellen.
― 7 min Lesedauer
MT-Diffusion generiert effizient mehrere Datentypen gleichzeitig und verbessert so KI-Anwendungen.
― 5 min Lesedauer
SV4D verwandelt ein einzelnes Video in eine dynamische 3D-Objdarstellung.
― 4 min Lesedauer