Eine Studie über die Verwendung von Bildern zur Trajektorienklassifikation und -vorhersage.
Mariaclaudia Nicolai, Raffaella Fiamma Cabini, Diego Ulisse Pizzagalli
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine Studie über die Verwendung von Bildern zur Trajektorienklassifikation und -vorhersage.
Mariaclaudia Nicolai, Raffaella Fiamma Cabini, Diego Ulisse Pizzagalli
― 5 min Lesedauer
Ein neues Verfahren verbessert den Wissensaustausch in Machine-Learning-Modellen.
Chaomin Shen, Yaomin Huang, Haokun Zhu
― 6 min Lesedauer
Diese Studie nutzt visuelle Fragenbeantwortung, um Diagramme zu bewerten, die von KI-Modellen erstellt wurden.
James Ford, Xingmeng Zhao, Dan Schumacher
― 8 min Lesedauer
Die Nutzung von Ontologie kann die Fähigkeit von MLLMs verbessern, Pflanzenkrankheiten genau zu identifizieren.
Jihen Amara, Birgitta König-Ries, Sheeba Samuel
― 6 min Lesedauer
Eine Methode vorstellen, wie KI Bilder erzeugen kann, ohne grosse gekennzeichnete Datensätze.
Zhiqiang Chen, Guofan Fan, Jinying Gao
― 8 min Lesedauer
GeCo verbessert das Zählen von Objekten mit weniger Beispielen und steigert die Genauigkeit und Zuverlässigkeit.
Jer Pelhan, Alan Lukežič, Vitjan Zavrtanik
― 6 min Lesedauer
Eine neue Methode verbessert die Bildprivatsphäre-Klassifizierung mit klaren, benutzerfreundlichen Erklärungen.
Alina Elena Baia, Andrea Cavallaro
― 7 min Lesedauer
Neue Methode verbessert CT-Bilder für bessere Planung von Krebsbehandlungen.
Belén Serrano-Antón, Mubashara Rehman, Niki Martinel
― 6 min Lesedauer
Verbesserungen in der LiDAR-Wahrnehmung steigern die Leistung in Multi-Sensor-Umgebungen.
Marc Uecker, J. Marius Zöllner
― 7 min Lesedauer
Ein umfassender Datensatz soll die Hochwasserprognose und Reaktionsmassnahmen weltweit verbessern.
Brandon Victor, Mathilde Letard, Peter Naylor
― 6 min Lesedauer
Ein Verfahren für klarere Satellitenbilder direkt aus unbearbeiteten Daten.
Michael Sprintson, Rama Chellappa, Cheng Peng
― 6 min Lesedauer
CION verbessert die Wiedererkennung von Personen, indem es sich auf Identitätskorrelationen über Videos hinweg konzentriert.
Jialong Zuo, Ying Nie, Hanyu Zhou
― 7 min Lesedauer
Ein Rahmen, der verschiedene Wissensarten kombiniert, um die Modellleistung zu verbessern.
Yaomin Huang, Zaomin Yan, Chaomin Shen
― 5 min Lesedauer
Eine neue Methode verbessert die Erkennung von Blickzielen mit weniger markierten Daten.
Francesco Tonini, Nicola Dall'Asen, Lorenzo Vaquero
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Leistung von Deep-Learning-Modellen trotz Rauschen.
Seyedarmin Azizi, Mohammad Erfan Sadeghi, Mehdi Kamal
― 5 min Lesedauer
Ein neues Framework verbessert die Pixelbeschriftung, indem es die Unsicherheit in der semantischen Segmentierung angeht.
Xiaoke Hao, Shiyu Liu, Chuanbo Feng
― 7 min Lesedauer
Diese Studie bewertet die Effektivität von vortrainierten Modellen in der Erdbeobachtung.
Jose Sosa, Mohamed Aloulou, Danila Rukhovich
― 7 min Lesedauer
Das Temporal2Seq Framework bündelt mehrere Aufgaben zur Videoverstehtnis in einem Modell.
Min Yang, Zichen Zhang, Limin Wang
― 8 min Lesedauer
TAKFL optimiert den Wissensaustausch im föderierten Lernen für unterschiedliche Gerätefähigkeiten.
Mahdi Morafah, Vyacheslav Kungurtsev, Hojin Chang
― 6 min Lesedauer
Eine Methode, die 3D-Formen mit 2D-Bildern ohne passende Punkte ausrichtet.
Jingwei Song, Maani Ghaffari
― 6 min Lesedauer
Erforsche die grundlegenden Konzepte der Molekularphysik und ihre praktischen Anwendungen.
Jun Liu, Geng Yuan, Weihao Zeng
― 4 min Lesedauer
Diese neue Methode macht die Bildgenerierung in KI-Modellen einfacher und verbessert die Effizienz und Geschwindigkeit.
Seongmin Hong, Suh Yoon Jeon, Kyeonghyun Lee
― 6 min Lesedauer
Ein neues Framework verbessert die Qualität von Video-Sprach-Datensätzen durch iterative Verfeinerung.
Xiao Wang, Jianlong Wu, Zijia Lin
― 5 min Lesedauer
Kombiniere Strassenansichten mit Daten, um die Gebäudefassaden zu analysieren.
Zongrong Li, Yunlei Su, Chenyuan Zhu
― 6 min Lesedauer
Ein Modell zur Bewertung der Segmentierungsqualität ohne Referenzdaten.
Ahjol Senbi, Tianyu Huang, Fei Lyu
― 8 min Lesedauer
MedCLIP-SAMv2 verbessert die Tumorerkennung mithilfe fortschrittlicher Segmentierungstechniken und minimalen beschrifteten Daten.
Taha Koleilat, Hojat Asgariandehkordi, Hassan Rivaz
― 6 min Lesedauer
Ein Blick darauf, wie CNNs Bildmerkmale lernen und ihre universellen Ähnlichkeiten.
Florentin Guth, Brice Ménard
― 7 min Lesedauer
Forscher nutzen CRISP, um die Verfolgung der Biodiversität durch bessere Bildanalyse zu verbessern.
Andy V. Huynh, Lauren E. Gillespie, Jael Lopez-Saucedo
― 7 min Lesedauer
Ein neuer Index hilft dabei, die Vielfalt in KI-generierten medizinischen Bildern zu bewerten.
Mohammed Talha Alam, Raza Imam, Mohammad Areeb Qazi
― 9 min Lesedauer
Neue Methoden beschleunigen die Video-Codierung und -Decodierung.
Hao Chen, Saining Xie, Ser-Nam Lim
― 5 min Lesedauer
Ein neues Framework verbessert die Verbindung zwischen Bildern und Text.
Mayug Maniparambil, Raiymbek Akshulakov, Yasser Abdelaziz Dahou Djilali
― 7 min Lesedauer
Lerne, wie Machine-Learning-Modelle besser werden können, wenn sie mit neuen und unbekannten Daten konfrontiert werden.
Zongbo Han, Jialong Yang, Junfan Li
― 7 min Lesedauer
Ein Blick auf die Rolle und Methoden von Diffusionsmodellen in der Bilderstellung.
Zheyuan Zhan, Defang Chen, Jian-Ping Mei
― 7 min Lesedauer
Methoden erkunden, um multimodale Modelle zu verbessern, die visuelle Fragen aufschlüsseln.
Haowei Zhang, Jianzhe Liu, Zhen Han
― 6 min Lesedauer
Ein neues Modell erstellt Berichte aus 3D-CT-Scans effizient und genau.
Hao Chen, Wei Zhao, Yingli Li
― 8 min Lesedauer
Eine neue Pipeline zum effizienten Erzeugen von 3D-Modellen aus 2D-Bildern.
Potito Aghilar, Vito Walter Anelli, Michelantonio Trizio
― 5 min Lesedauer
TrojVLM zeigt Schwachstellen in Vision Language Models für Backdoor-Angriffe auf.
Weimin Lyu, Lu Pang, Tengfei Ma
― 8 min Lesedauer
Diese Studie zeigt effektive Methoden zur Erkennung von Handgesten durch Ultraschallbildgebung.
Keshav Bimbraw, Ankit Talele, Haichong K. Zhang
― 6 min Lesedauer
Ein neues Framework verbessert die Datengenerierung über verschiedene Quellen mithilfe von energie-basierten Modellen.
Shiyu Yuan, Jiali Cui, Hanao Li
― 6 min Lesedauer
SATA verbessert die Robustheit und Effizienz von Vision Transformers bei Bildklassifizierungsaufgaben.
Nick Nikzad, Yi Liao, Yongsheng Gao
― 5 min Lesedauer