Entdecke, wie Wortarten unsere Kommunikation und Bedeutung beeinflussen.
Coleman Haley, Sharon Goldwater, Edoardo Ponti
― 7 min Lesedauer
New Science Research Articles Everyday
Entdecke, wie Wortarten unsere Kommunikation und Bedeutung beeinflussen.
Coleman Haley, Sharon Goldwater, Edoardo Ponti
― 7 min Lesedauer
OP-LoRA verbessert KI-Modelle für spezielle Aufgaben und steigert Effizienz und Leistung.
Piotr Teterwak, Kate Saenko, Bryan A. Plummer
― 6 min Lesedauer
Die wichtigsten Elemente für das Verständnis von Videos in grossen multimodalen Modellen aufschlüsseln.
Orr Zohar, Xiaohan Wang, Yann Dubois
― 8 min Lesedauer
Eine neue Methode verbessert die Bildfusion für mehr Details und Klarheit.
Ferhat Can Ataman, Gözde Bozdaği Akar
― 7 min Lesedauer
Ein neues Modell verbessert die Genauigkeit bei der Messung der Kronenhöhe für ein besseres Waldmanagement.
Tony Chang, Kiarie Ndegwa, Andreas Gros
― 8 min Lesedauer
AlignCap verbessert Bildbeschreibungen, damit Maschinen visuelle Details effektiv kommunizieren können.
Yuan Sun, Zhao Zhang, Jorge Ortiz
― 6 min Lesedauer
DeepSeek-VL2 kombiniert visuelle und Textdaten für schlauere KI-Interaktionen.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 min Lesedauer
Neue Methoden in der 3D-Rekonstruktion bringen echte Anwendungen zum Leben.
Manuel Dahnert, Angela Dai, Norman Müller
― 5 min Lesedauer
Entdecke, wie prompt-gesteuerte Segmentierung die Bildkennungstechnologie verändert.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 8 min Lesedauer
UnPIC verwandelt 2D-Bilder ganz easy in beeindruckende 3D-Darstellungen.
Rishabh Kabra, Drew A. Hudson, Sjoerd van Steenkiste
― 8 min Lesedauer
SuperGSeg bringt Klarheit in komplexe 3D-Szenen durch fortschrittliche Segmentierungstechniken.
Siyun Liang, Sen Wang, Kunyi Li
― 7 min Lesedauer
Fortgeschrittene Bearbeitungstechnologie bringt lebensechte Bilder zum Leben.
Nikolai Warner, Jack Kolb, Meera Hahn
― 8 min Lesedauer
Entdecke die faszinierende Welt der realistischen 3D-Head-Avatare aus Videos.
Jiapeng Tang, Davide Davoli, Tobias Kirschstein
― 8 min Lesedauer
Multi-Head-Encoding verwandelt die Klassifizierung mit extrem vielen Labels in eine handhabbare Aufgabe.
Daojun Liang, Haixia Zhang, Dongfeng Yuan
― 7 min Lesedauer
Entdecke, wie die Video-Anprobe-Technologie unsere Art zu shoppen verändert.
Hung Nguyen, Quang Qui-Vinh Nguyen, Khoi Nguyen
― 6 min Lesedauer
Entdecke, wie WordVIS die Dokumentenklassifizierung mit Farbe vereinfacht.
Umar Khan, Saifullah, Stefan Agne
― 6 min Lesedauer
Entdecke Fortschritte bei der Verbesserung der Fotografie und Bildqualität bei schwachem Licht.
Igor Morawski, Kai He, Shusil Dangi
― 9 min Lesedauer
Ein neuer Test für Maschinen, um Bild- und Textfragen zu beantworten.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 8 min Lesedauer
Entdecke, wie visuelle Illusionen unsere Wahrnehmung täuschen und unser tägliches Leben beeinflussen.
Alex Gomez-Villa, Kai Wang, Alejandro C. Parraga
― 8 min Lesedauer
Forscher haben eine Methode entwickelt, um Bewegungsartefakte in MRT-Scans zu reduzieren.
Jiahua Xu, Dawei Zhou, Lei Hu
― 5 min Lesedauer
Entdecke eine schnelle Methode, um detaillierte 3D-Modelle zu erstellen.
Briac Toussaint, Diego Thomas, Jean-Sébastien Franco
― 6 min Lesedauer
ManipGPT vereinfacht robotische Aufgaben und ermöglicht smartere Objektinteraktionen.
Taewhan Kim, Hojin Bae, Zeming Li
― 7 min Lesedauer
Erfahre, wie neue Wasserzeichenmethoden deine Bilder online schützen.
Runyi Hu, Jie Zhang, Yiming Li
― 5 min Lesedauer
Deep Learning bietet neue Hoffnungen für eine effiziente Diagnose von Kniearthrose.
Nicharee Srikijkasemwat, Soumya Snigdha Kundu, Fuping Wu
― 6 min Lesedauer
Neue Methoden verbessern die Bildbeschriftung für bessere Modellleistung und Effizienz.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 7 min Lesedauer
Lerne, wie Distanzfunktionen unser Verständnis von Raum formen und die Technologie verbessern.
Alexander Belyaev, Pierre-Alain Fayolle
― 6 min Lesedauer
Entdecke, wie Maschinen ihr Verständnis von Bildern und Texten verbessern.
Yeyuan Wang, Dehong Gao, Lei Yi
― 7 min Lesedauer
waveOrder ermöglicht es Wissenschaftlern, Zellen zu untersuchen, ohne sie zu stören, dank innovativer Bildgebung.
Talon Chandler, Eduardo Hirata-Miyasaki, Ivan E. Ivanov
― 7 min Lesedauer
Entdecke, wie KI das Sounddesign in Videos und Spielen verändern kann.
Sudha Krishnamurthy
― 6 min Lesedauer
Verwandle Videos mit einer einzigen Kamera mühelos in dynamische Perspektiven.
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello
― 6 min Lesedauer
Eine neue Methode verbessert die Datensatz-Destillation für effiziente Bilderkennung.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 6 min Lesedauer
Eine neue Methode, um effiziente synthetische Datensätze für Deep-Learning-Modelle zu erstellen.
Xinhao Zhong, Bin Chen, Hao Fang
― 8 min Lesedauer
Erfahre, wie Lidar-Technologie deine Fotos schärfer macht und Unschärfe reduziert.
Ziyao Yi, Diego Valsesia, Tiziano Bianchi
― 7 min Lesedauer
Verwandle deine Mahlzeiten in Kalorieninfos mit einem einfachen Foto.
Dongyu Yao, Keling Yao, Junhong Zhou
― 8 min Lesedauer
Ein neues Modell verändert, wie wir Videoinhalte effizient analysieren.
Zhuqiang Lu, Zhenfei Yin, Mengwei He
― 6 min Lesedauer
Eine neue Methode verbessert die Erstellung von adversarialen Bildern in der medizinischen Bildgebung.
Yasamin Medghalchi, Moein Heidari, Clayton Allard
― 7 min Lesedauer
Ein neues Framework verbessert, wie wir lange Videos effizient verarbeiten.
Sosuke Yamao, Natsuki Miyahara, Yuki Harazono
― 7 min Lesedauer
Entdecke, wie STDD die Aktionserkennung in Videos verbessert.
Yating Yu, Congqi Cao, Yueran Zhang
― 5 min Lesedauer
VQTalker erstellt realistische sprechende Avatare in mehreren Sprachen und verbessert die digitalen Interaktionen.
Tao Liu, Ziyang Ma, Qi Chen
― 7 min Lesedauer
Erforschen, wie Schüler besser lernen können als ihre Lehrer in Künstlicher Intelligenz.
Jianhua Zhang, Yi Gao, Ruyu Liu
― 6 min Lesedauer