Ein neues Framework verbessert die Leistung von CLIP durch effektive Token-Pruning-Techniken.
Cheng-En Wu, Jinhong Lin, Yu Hen Hu
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues Framework verbessert die Leistung von CLIP durch effektive Token-Pruning-Techniken.
Cheng-En Wu, Jinhong Lin, Yu Hen Hu
― 6 min Lesedauer
Eine neue Methode verbessert die Stadtentwicklung, indem sie Technologie mit Feedback aus der Community kombiniert.
Chuanbo Hu, Shan Jia, Xin Li
― 8 min Lesedauer
Eine neue Methode verbessert die Nachverfolgungsgenauigkeit in schnellen Szenen mithilfe von ereignisbasierten Technologien.
Maria Zafeiri, Georgios Evangelidis, Emmanouil Psarakis
― 5 min Lesedauer
Diese Forschung zielt darauf ab, virtuelle Anprobe-Tools für Schmuck und Uhren zu verbessern.
Ting-Yu Chang, Seretsi Khabane Lekena
― 6 min Lesedauer
Eine neue Methode verbessert, wie Roboter Objekte effektiv greifen und halten.
Ninad Khargonkar, Luis Felipe Casas, Balakrishnan Prabhakaran
― 6 min Lesedauer
Video-XL verarbeitet lange Videos effizient und verbessert Genauigkeit und Leistung.
Yan Shu, Peitian Zhang, Zheng Liu
― 6 min Lesedauer
Das PACU-Framework verbessert VLLMs, indem es die Eingabeaufforderungen verfeinert und Bildunterschriften nutzt.
Minyi Zhao, Jie Wang, Zhaoyang Li
― 6 min Lesedauer
Eine neue Methode verbessert die Lesegenauigkeit von Text aus unscharfen Bildern.
Minyi Zhao, Yang Wang, Jihong Guan
― 5 min Lesedauer
Eine neue Datensatz für die Registrierung von nicht-rigiden Punktwolken erkunden.
Sara Monji-Azad, Marvin Kinz, Claudia Scherl
― 6 min Lesedauer
MRI-Radiomics verbessert die Glioblastom-Diagnose durch Vorhersage genetischer Marker.
Stanislav Kozák
― 6 min Lesedauer
Eine neue Methode, um individuelle Rechte vor dem Missbrauch von Bildern in Animationen zu schützen.
Jiachen Zhou, Mingsi Wang, Tianlin Li
― 6 min Lesedauer
Die Forschung konzentriert sich auf bessere Bildbeschreibungen und Techniken für den robotischen Umgang.
Huy Hoang Nguyen, An Vuong, Anh Nguyen
― 7 min Lesedauer
Neue Methoden verbessern RNA-Abstandsprognosen mit fortschrittlichen Machine-Learning-Techniken.
Jiaxing Yang
― 4 min Lesedauer
Ein neuer Ansatz verbessert die Video-Fragenbeantwortung durch Szenen-Text-Erkennung.
Sheng Zhou, Junbin Xiao, Xun Yang
― 6 min Lesedauer
Dieser Artikel bespricht DilateQuant zur Verbesserung der Geschwindigkeit und Genauigkeit von Diffusionsmodellen.
Xuewen Liu, Zhikai Li, Qingyi Gu
― 7 min Lesedauer
Das Balancieren von Privatsphäre und Performance in KI durch innovative Unlearning-Techniken.
Dasol Choi, Dongbin Na
― 6 min Lesedauer
EVA kombiniert Audio- und visuelle Signale für eine bessere Spracherkennungsgenauigkeit.
Yihan Wu, Yifan Peng, Yichen Lu
― 5 min Lesedauer
PPNG bietet eine kompakte Möglichkeit, 3D-Visualisierungen einfach festzuhalten und zu teilen.
Jae Yong Lee, Yuqun Wu, Chuhang Zou
― 6 min Lesedauer
Neue Datensätze und Modelle verbessern die Erkennung von Schädlingen und Krankheiten in Bäumen und Pflanzen.
Mingle Zhou, Rui Xing, Delong Han
― 8 min Lesedauer
Neue Methoden verbessern die Genauigkeit bei der Identifizierung von Blutgefässen in medizinischen Bildern.
Amine Sadikine, Bogdan Badic, Enzo Ferrante
― 6 min Lesedauer
Dieser Artikel behandelt die Effektivität von Structure from Motion für präzises 3D-Modellieren.
Francisco Roza de Moraes, Irineu da Silva
― 6 min Lesedauer
Eine neue Methode verbessert, wie Roboter strukturierte Innenräume erkunden.
Cherie Ho, Seungchan Kim, Brady Moon
― 5 min Lesedauer
Ein automatisiertes Modell verbessert die Erstellung von Berichten über Mehrorganpathologien.
Jing Wei Tan, SeungKyu Kim, Eunsu Kim
― 5 min Lesedauer
Eine neue Methode verbessert die Segmentierung von Lebergefässen in der medizinischen Bildgebung.
Amine Sadikine, Bogdan Badic, Jean-Pierre Tasu
― 5 min Lesedauer
Eine neue Methode beschleunigt Diffusionsmodelle und hält dabei die Bildqualität hoch.
Alireza Ganjdanesh, Yan Kang, Yuchen Liu
― 6 min Lesedauer
Ein neuer Ansatz kombiniert LiDAR und Kameras für eine bessere Erkennungsgenauigkeit.
Vanshika Vats, Marzia Binta Nizam, James Davis
― 6 min Lesedauer
Neue Methoden verbessern die Objektverfolgung in dicht besiedelten städtischen Gebieten.
Tavis Shore, Oscar Mendez, Simon Hadfield
― 7 min Lesedauer
Diese Studie untersucht, wie Leute zwischen echten und KI-generierten Gesichtern unterscheiden.
Jin Huang, Subhadra Gopalakrishnan, Trisha Mittal
― 6 min Lesedauer
Llama-AVSR kombiniert Audio- und visuelle Eingaben für eine verbesserte Spracherkennungsgenauigkeit.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 6 min Lesedauer
Ein System, das Robotern ermöglicht, autonome Erkundungen und Aktualisierungen von Innenkarten durchzuführen.
Sai Haneesh Allu, Itay Kadosh, Tyler Summers
― 6 min Lesedauer
Einführung von anpassbaren Kernen für eine verbesserte 3D-Formrekonstruktion aus begrenzten Daten.
Maximilian Weiherer, Bernhard Egger
― 5 min Lesedauer
Ein neues Modell, das VAE und QWGAN kombiniert, verbessert die Bildqualität und -vielfalt.
Aaron Mark Thomas, Sharu Theresa Jose
― 5 min Lesedauer
Neue Methode verbessert die Genauigkeit der medizinischen Bildanalyse.
Sebastian Doerrich, Francesco Di Salvo, Christian Ledig
― 6 min Lesedauer
Ein neues Tool bewertet die Leistung grosser Sprachmodelle über verschiedene Datentypen hinweg.
Yizhi Li, Ge Zhang, Yinghao Ma
― 5 min Lesedauer
KI nutzen, um die Erkennung von Läsionen in der Krebsbildgebung zu verbessern.
Shadab Ahamed
― 5 min Lesedauer
Eine neue Methode verbessert die 3D-Rekonstruktion von Leuten in lockerer Kleidung.
Chen Guo, Tianjian Jiang, Manuel Kaufmann
― 5 min Lesedauer
Dieser Artikel untersucht Methoden zur Verbesserung der UDA-Leistung bei Bildklassifizierungsaufgaben.
Tarun Kalluri, Sreyas Ravichandran, Manmohan Chandraker
― 6 min Lesedauer
ZeroSCD erkennt Änderungen in Bildern, ohne dass vorheriges Training oder beschriftete Daten erforderlich sind.
Shyam Sundar Kannan, Byung-Cheol Min
― 6 min Lesedauer
Robot-Hunde könnten die Überwachung und Datensammlung auf Baustellen revolutionieren.
Miguel Arturo Vega Torres, Fabian Pfitzner
― 6 min Lesedauer
Neue Methoden mit Sprachmodellen verbessern die Datenverarbeitung in Erdbeobachtungssystemen.
Hong-fu Chou, Vu Nguyen Ha, Prabhu Thiruvasagam
― 7 min Lesedauer