Entdecke, wie Textur-Bias die Entscheidungen von KI und die Objekterkennung beeinflusst.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 6 min Lesedauer
New Science Research Articles Everyday
Entdecke, wie Textur-Bias die Entscheidungen von KI und die Objekterkennung beeinflusst.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 6 min Lesedauer
Neueste Artikel
Sara Ghazanfari, Siddharth Garg, Nicolas Flammarion
― 7 min Lesedauer
Yiwen Gu, Mahir Patel, Margrit Betke
― 5 min Lesedauer
Umar Khalid, Hasan Iqbal, Azib Farooq
― 8 min Lesedauer
Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu
― 6 min Lesedauer
Joshua Adrian Cahyono, Jeremy Nathan Jusuf
― 7 min Lesedauer
Entdecke, wie mobile Geräte die Videoproduktion für jeden verändern.
Yushu Wu, Zhixing Zhang, Yanyu Li
― 6 min Lesedauer
Neue Technik verbessert die Bildanalyse für eine bessere Krankheitsdiagnose.
Zhenfeng Zhuang, Min Cen, Yanfeng Li
― 7 min Lesedauer
Ein neuer Datensatz revolutioniert die Analyse von medizinischen Bildern und deren Beschreibungen.
Muhammad Uzair Khattak, Shahina Kunhimon, Muzammal Naseer
― 8 min Lesedauer
Entdecke, wie Wortarten unsere Kommunikation und Bedeutung beeinflussen.
Coleman Haley, Sharon Goldwater, Edoardo Ponti
― 7 min Lesedauer
OP-LoRA verbessert KI-Modelle für spezielle Aufgaben und steigert Effizienz und Leistung.
Piotr Teterwak, Kate Saenko, Bryan A. Plummer
― 6 min Lesedauer
Die wichtigsten Elemente für das Verständnis von Videos in grossen multimodalen Modellen aufschlüsseln.
Orr Zohar, Xiaohan Wang, Yann Dubois
― 8 min Lesedauer
Eine neue Methode verbessert die Bildfusion für mehr Details und Klarheit.
Ferhat Can Ataman, Gözde Bozdaği Akar
― 7 min Lesedauer
Ein neues Modell verbessert die Genauigkeit bei der Messung der Kronenhöhe für ein besseres Waldmanagement.
Tony Chang, Kiarie Ndegwa, Andreas Gros
― 8 min Lesedauer
AlignCap verbessert Bildbeschreibungen, damit Maschinen visuelle Details effektiv kommunizieren können.
Yuan Sun, Zhao Zhang, Jorge Ortiz
― 6 min Lesedauer
DeepSeek-VL2 kombiniert visuelle und Textdaten für schlauere KI-Interaktionen.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 min Lesedauer
Neue Methoden in der 3D-Rekonstruktion bringen echte Anwendungen zum Leben.
Manuel Dahnert, Angela Dai, Norman Müller
― 5 min Lesedauer
Entdecke, wie prompt-gesteuerte Segmentierung die Bildkennungstechnologie verändert.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 8 min Lesedauer
UnPIC verwandelt 2D-Bilder ganz easy in beeindruckende 3D-Darstellungen.
Rishabh Kabra, Drew A. Hudson, Sjoerd van Steenkiste
― 8 min Lesedauer
SuperGSeg bringt Klarheit in komplexe 3D-Szenen durch fortschrittliche Segmentierungstechniken.
Siyun Liang, Sen Wang, Kunyi Li
― 7 min Lesedauer
Fortgeschrittene Bearbeitungstechnologie bringt lebensechte Bilder zum Leben.
Nikolai Warner, Jack Kolb, Meera Hahn
― 8 min Lesedauer
Entdecke die faszinierende Welt der realistischen 3D-Head-Avatare aus Videos.
Jiapeng Tang, Davide Davoli, Tobias Kirschstein
― 8 min Lesedauer
Multi-Head-Encoding verwandelt die Klassifizierung mit extrem vielen Labels in eine handhabbare Aufgabe.
Daojun Liang, Haixia Zhang, Dongfeng Yuan
― 7 min Lesedauer
Entdecke, wie die Video-Anprobe-Technologie unsere Art zu shoppen verändert.
Hung Nguyen, Quang Qui-Vinh Nguyen, Khoi Nguyen
― 6 min Lesedauer
Entdecke, wie WordVIS die Dokumentenklassifizierung mit Farbe vereinfacht.
Umar Khan, Saifullah, Stefan Agne
― 6 min Lesedauer
Entdecke Fortschritte bei der Verbesserung der Fotografie und Bildqualität bei schwachem Licht.
Igor Morawski, Kai He, Shusil Dangi
― 9 min Lesedauer
Ein neuer Test für Maschinen, um Bild- und Textfragen zu beantworten.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 8 min Lesedauer
Entdecke, wie visuelle Illusionen unsere Wahrnehmung täuschen und unser tägliches Leben beeinflussen.
Alex Gomez-Villa, Kai Wang, Alejandro C. Parraga
― 8 min Lesedauer
Forscher haben eine Methode entwickelt, um Bewegungsartefakte in MRT-Scans zu reduzieren.
Jiahua Xu, Dawei Zhou, Lei Hu
― 5 min Lesedauer
Entdecke eine schnelle Methode, um detaillierte 3D-Modelle zu erstellen.
Briac Toussaint, Diego Thomas, Jean-Sébastien Franco
― 6 min Lesedauer
ManipGPT vereinfacht robotische Aufgaben und ermöglicht smartere Objektinteraktionen.
Taewhan Kim, Hojin Bae, Zeming Li
― 7 min Lesedauer
Erfahre, wie neue Wasserzeichenmethoden deine Bilder online schützen.
Runyi Hu, Jie Zhang, Yiming Li
― 5 min Lesedauer
Deep Learning bietet neue Hoffnungen für eine effiziente Diagnose von Kniearthrose.
Nicharee Srikijkasemwat, Soumya Snigdha Kundu, Fuping Wu
― 6 min Lesedauer
Neue Methoden verbessern die Bildbeschriftung für bessere Modellleistung und Effizienz.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 7 min Lesedauer
Lerne, wie Distanzfunktionen unser Verständnis von Raum formen und die Technologie verbessern.
Alexander Belyaev, Pierre-Alain Fayolle
― 6 min Lesedauer
Entdecke, wie Maschinen ihr Verständnis von Bildern und Texten verbessern.
Yeyuan Wang, Dehong Gao, Lei Yi
― 7 min Lesedauer
waveOrder ermöglicht es Wissenschaftlern, Zellen zu untersuchen, ohne sie zu stören, dank innovativer Bildgebung.
Talon Chandler, Eduardo Hirata-Miyasaki, Ivan E. Ivanov
― 7 min Lesedauer
Entdecke, wie KI das Sounddesign in Videos und Spielen verändern kann.
Sudha Krishnamurthy
― 6 min Lesedauer
Verwandle Videos mit einer einzigen Kamera mühelos in dynamische Perspektiven.
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello
― 6 min Lesedauer
Eine neue Methode verbessert die Datensatz-Destillation für effiziente Bilderkennung.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 6 min Lesedauer
Eine neue Methode, um effiziente synthetische Datensätze für Deep-Learning-Modelle zu erstellen.
Xinhao Zhong, Bin Chen, Hao Fang
― 8 min Lesedauer
Erfahre, wie Lidar-Technologie deine Fotos schärfer macht und Unschärfe reduziert.
Ziyao Yi, Diego Valsesia, Tiziano Bianchi
― 7 min Lesedauer
Verwandle deine Mahlzeiten in Kalorieninfos mit einem einfachen Foto.
Dongyu Yao, Keling Yao, Junhong Zhou
― 8 min Lesedauer
Ein neues Modell verändert, wie wir Videoinhalte effizient analysieren.
Zhuqiang Lu, Zhenfei Yin, Mengwei He
― 6 min Lesedauer
Eine neue Methode verbessert die Erstellung von adversarialen Bildern in der medizinischen Bildgebung.
Yasamin Medghalchi, Moein Heidari, Clayton Allard
― 7 min Lesedauer
Ein neues Framework verbessert, wie wir lange Videos effizient verarbeiten.
Sosuke Yamao, Natsuki Miyahara, Yuki Harazono
― 7 min Lesedauer
Entdecke, wie STDD die Aktionserkennung in Videos verbessert.
Yating Yu, Congqi Cao, Yueran Zhang
― 5 min Lesedauer
VQTalker erstellt realistische sprechende Avatare in mehreren Sprachen und verbessert die digitalen Interaktionen.
Tao Liu, Ziyang Ma, Qi Chen
― 7 min Lesedauer
Erforschen, wie Schüler besser lernen können als ihre Lehrer in Künstlicher Intelligenz.
Jianhua Zhang, Yi Gao, Ruyu Liu
― 6 min Lesedauer
Forscher haben herausgefunden, wie KI das menschliche Sehen durch Faltungsneuronale Netze nachahmt.
Yudi Xie, Weichen Huang, Esther Alter
― 7 min Lesedauer
Eine neue Methode verbessert die OCR-Genauigkeit für unterrepräsentierte Sprachen.
Harshvivek Kashid, Pushpak Bhattacharyya
― 9 min Lesedauer
Entdecke, wie VehiclePaliGemma die Technologie zur Kennzeichenlesung verändert.
Nouar AlDahoul, Myles Joshua Toledo Tan, Raghava Reddy Tera
― 7 min Lesedauer
Eine neue Methode nutzt 3D-Scans für Gesichtsvorhersagen nach der Operation.
Huijun Han, Congyi Zhang, Lifeng Zhu
― 8 min Lesedauer
Entdecke, wie AURORA virtuelles Interior Design für Profis und Enthusiasten vereinfacht.
Huijun Han, Yongqing Liang, Yuanlong Zhou
― 8 min Lesedauer
Verwandle einfache Anfragen in lebendige Bildbeschreibungen mit CapAgent.
Xinran Wang, Muxi Diao, Baoteng Li
― 6 min Lesedauer
Entdecke, wie generative Modelle neue Daten mit einzigartigen Ansätzen erstellen.
Zeeshan Patel, James DeLoye, Lance Mathias
― 8 min Lesedauer
Neue Methoden verbessern die Fehlererkennung in der industriellen Bildverarbeitung.
Alejandro Garnung Menéndez
― 7 min Lesedauer
RapidNet verbessert die Geschwindigkeit und Genauigkeit der mobilen Bildverarbeitung.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 6 min Lesedauer
Die Analyse von Stimmen kann Anzeichen von Depressionen zeigen und zu einer frühen Intervention führen.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 min Lesedauer
Lern, wie 3D-Segmentierung Robotern hilft, Objekte in komplexen Umgebungen zu erkennen und zu kennzeichnen.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 6 min Lesedauer
Entdecke, wie SoftVQ-VAE die Bilderstellung mit Effizienz und Qualität verbessert.
Hao Chen, Ze Wang, Xiang Li
― 6 min Lesedauer
Eine neue Methode entfernt effektiv Reflexionen aus Bildern mit fortschrittlichen Techniken.
Abdelrahman Elnenaey, Marwan Torki
― 8 min Lesedauer
SegHeD+ verbessert die Genauigkeit bei der Identifizierung von Läsionen bei Multipler Sklerose.
Berke Doga Basaran, Paul M. Matthews, Wenjia Bai
― 5 min Lesedauer
Forscher arbeiten daran, KI-Erklärungen klarer und zuverlässiger zu machen.
Miquel Miró-Nicolau, Antoni Jaume-i-Capó, Gabriel Moyà-Alcover
― 7 min Lesedauer
Lerne, wie Maschinen Videos interpretieren, von lustigen Clips bis hin zu wichtigen Anwendungen.
Katrina Drozdov, Ravid Shwartz-Ziv, Yann LeCun
― 7 min Lesedauer
HGT-Track kombiniert sichtbare und thermale Kameras für effektives Verfolgen von kleinen Objekten.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 4 min Lesedauer
Das SEW-Framework revolutioniert die Bildanalyse in der Pathologie für eine bessere Krebsbehandlung.
Haoming Luo, Xiaotian Yu, Shengxuming Zhang
― 6 min Lesedauer
KI-Systeme verbessern ihr Verständnis von grafischen Benutzeroberflächen für bessere Benutzererlebnisse.
Hai-Ming Xu, Qi Chen, Lei Wang
― 8 min Lesedauer
Entdecke, wie Technologie Familienmerkmale mit hochwertiger Bilderzeugung vorhersagt.
Pin-Yen Chiu, Dai-Jie Wu, Po-Hsun Chu
― 7 min Lesedauer
Entdecke, wie In-Context-Lernen die Videokreation verändert.
Zhengcong Fei, Di Qiu, Changqian Yu
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit und Effizienz bei audio-visuellen Fragen und Antworten.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 7 min Lesedauer
Entdecke, wie geteilte Daten autonomes Fahren sicherer und smarter machen.
Jingyu Zhang, Yilei Wang, Lang Qian
― 7 min Lesedauer
Ein neues Framework, um Videos und Bilder effizient zu erstellen.
Cong Wan, Xiangyang Luo, Zijian Cai
― 6 min Lesedauer
Eine neue Methode verbessert die Personenidentifikation mithilfe von Informationen aus benachbarten Bildern.
Xiao Teng, Long Lan, Dingyao Chen
― 8 min Lesedauer
Neuer Datensatz ermöglicht bessere Vergleiche von CT-Rekonstruktionsalgorithmen.
Maximilian B. Kiss, Ander Biguri, Zakhar Shumaylov
― 7 min Lesedauer
Neue Methode verbessert die Erkennung abnormaler Geweberegionen in der medizinischen Forschung.
Kaichen Xu, Qilong Wu, Yan Lu
― 5 min Lesedauer
Ein neues System hilft dabei, die Sitzgewohnheiten zu überwachen und zu verbessern für eine bessere Gesundheit.
Hang Jin, Xin He, Lingyun Wang
― 7 min Lesedauer
Eine neue Methode verbessert maschinelles Lernen ohne die Originaldaten.
Yingping Liang, Ying Fu
― 6 min Lesedauer
Ein frischer Ansatz hilft dabei, nervige Lens Flares in Bildern mit mehreren Ansichten zu entfernen.
Gopi Raju Matta, Rahul Siddartha, Rongali Simhachala Venkata Girish
― 8 min Lesedauer
Revolutioniere dein Videoerlebnis mit modernen Frame-Interpolationstechniken.
Wonyong Seo, Jihyong Oh, Munchurl Kim
― 5 min Lesedauer
Roboter lernen jetzt Aufgaben, indem sie Menschen zuschauen, was die Zusammenarbeit in verschiedenen Branchen verbessert.
Ehsan Asali, Prashant Doshi
― 10 min Lesedauer
Entdeck, wie Bildveränderungen unsere Sicht auf visuelle Inhalte beeinflussen.
Paula Daudén-Oliver, David Agost-Beltran, Emilio Sansano-Sansano
― 8 min Lesedauer
Neues Modell erstellt Schriftarten für verschiedene Sprachen und löst Designprobleme effizient.
Zhiheng Wang, Jiarui Liu
― 6 min Lesedauer
Ein neues Framework verbessert die Abstimmung von Sounds und Bildern in Videos.
Kexin Li, Zongxin Yang, Yi Yang
― 6 min Lesedauer
Neue Methoden ermöglichen es Maschinen, Emotionen in VR anhand von Gesichtsausdrücken zu lesen.
Thorben Ortmann, Qi Wang, Larissa Putzar
― 8 min Lesedauer
Forscher entwickeln eine neue Methode, um die Bewegungsverfolgung mit normaler Flussabschätzung zu verbessern.
Dehao Yuan, Levi Burner, Jiayi Wu
― 6 min Lesedauer