Entdecke, wie Maschinen die Kunstschöpfung ohne traditionelle Ausbildung neu definieren.
Hui Ren, Joanna Materzynska, Rohit Gandikota
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Entdecke, wie Maschinen die Kunstschöpfung ohne traditionelle Ausbildung neu definieren.
Hui Ren, Joanna Materzynska, Rohit Gandikota
― 8 min Lesedauer
Entdecke, wie lebensechte Charaktere virtuelle Interaktionen verändern.
Jianping Jiang, Weiye Xiao, Zhengyu Lin
― 7 min Lesedauer
Forscher haben eine Methode entwickelt, mit der Drohnen die Standortgenauigkeit durch 3D-Bilder verbessern können.
Haoyuan Li, Chang Xu, Wen Yang
― 6 min Lesedauer
Ein neues Tool, das Fragen aus Dokumenten genau und transparent beantwortet.
Ahmad Mohammadshirazi, Pinaki Prasad Guha Neogi, Ser-Nam Lim
― 6 min Lesedauer
Wir stellen DELT vor, um die Bildvielfalt bei der Dataset-Destillation zu verbessern.
Zhiqiang Shen, Ammar Sherif, Zeyuan Yin
― 5 min Lesedauer
Drohnen brauchen bessere Trainingsdaten, um die realen Umgebungen richtig zu verstehen.
Alina Marcu
― 7 min Lesedauer
C 3-NeRF vereinfacht 3D-Modellierung und ermöglicht effizientes Handling von mehreren Szenen.
Prajwal Singh, Ashish Tiwari, Gautam Vashishtha
― 6 min Lesedauer
SpaRC verbessert das Fahrzeugbewusstsein, indem es Radar- und Kameradaten kombiniert, um Objekte besser zu erkennen.
Philipp Wolters, Johannes Gilg, Torben Teepe
― 5 min Lesedauer
Die Bedeutung einzelner Klassen in Bildklassifizierungsmodellen erkunden.
Tejaswini Medi, Julia Grabinski, Margret Keuper
― 6 min Lesedauer
Wir präsentieren ein innovatives Tool, um 3D-Räume mit präzisen Details zu verstehen.
Guofeng Mei, Wei Lin, Luigi Riz
― 6 min Lesedauer
LongVALE setzt einen neuen Massstab dafür, lange Videos durch audio-visuelle Daten zu verstehen.
Tiantian Geng, Jinrui Zhang, Qingni Wang
― 7 min Lesedauer
Lern, wie eine neue Technik dir helfen kann, wichtige Elemente von Ablenkungen in Fotos zu trennen.
Yihao Wang, Marcus Klasson, Matias Turkulainen
― 6 min Lesedauer
Teste verschiedene Modelle zur Erkennung von ungewöhnlichen Aktivitäten in Videodaten.
Fabien Poirier
― 12 min Lesedauer
JetFormer erstellt Bilder und Texte zusammen auf eine effiziente Art.
Michael Tschannen, André Susano Pinto, Alexander Kolesnikov
― 6 min Lesedauer
Neue Methode verbessert die Tiefenschätzung für selbstfahrende Autos nur mit einem Bild.
Gasser Elazab, Torben Gräber, Michael Unterreiner
― 6 min Lesedauer
SASS bietet smarte Lösungen für ein sicheres und besseres Leben in der Stadt.
Navid Salami Pargoo, Mahshid Ghasemi, Shuren Xia
― 7 min Lesedauer
CogACT kombiniert Sprache und Handlung für intelligentere Roboter im Alltag.
Qixiu Li, Yaobo Liang, Zeyu Wang
― 6 min Lesedauer
Ein neuer Ansatz macht multimodale Modelle schneller und effizienter.
Qiong Wu, Wenhao Lin, Weihao Ye
― 5 min Lesedauer
Lern, wie TOrtho-Gaussian die Erstellung von echten digitalen Karten verbessert.
Xin Wang, Wendi Zhang, Hong Xie
― 7 min Lesedauer
FLD+ verbessert die Bewertung von computer-generierten Bildern mit weniger und genaueren Massstäben.
Pranav Jeevan, Neeraj Nixon, Amit Sethi
― 5 min Lesedauer
MulModSeg vereinfacht die Segmentierung medizinischer Bilder für bessere Diagnosen und Behandlungen.
Chengyin Li, Hui Zhu, Rafi Ibn Sultan
― 5 min Lesedauer
MotionPrompt verbessert die Videoproduktion und sorgt für flüssige und gleichmässige Bewegungen.
Hyelin Nam, Jaemin Kim, Dohun Lee
― 7 min Lesedauer
SkelMamba verbessert die Bewegungsanalyse im Gesundheitswesen mit Skelettdaten.
Niki Martinel, Mariano Serrao, Christian Micheloni
― 6 min Lesedauer
RAGDiffusion hilft dabei, realistische Kleidungsbilder zu erstellen, indem es fortschrittliche Datensammlung und Bildgenerierung nutzt.
Xianfeng Tan, Yuhan Li, Wenxiang Shang
― 6 min Lesedauer
Untersuchung von Qualitätsbewertungen für 3D-Videos, die von Umwelteinflüssen betroffen sind.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil
― 5 min Lesedauer
Innovative Methoden verbessern die Daten Gruppierung mit Deep Learning und K-Means Clustering.
Debapriya Roy
― 5 min Lesedauer
Ein neuer Ansatz für ein besseres Verständnis von Bildern und Text durch KI.
Jun Gao, Yongqi Li, Ziqiang Cao
― 6 min Lesedauer
Sketch2Cinemagraph lässt dich beeindruckende animierte Bilder aus einfachen Zeichnungen erstellen.
Hao Jin, Hengyuan Chang, Xiaoxuan Xie
― 8 min Lesedauer
VideoSAVi verändert, wie Computer Videos durch Selbsttraining interpretieren.
Yogesh Kulkarni, Pooyan Fazli
― 8 min Lesedauer
Eine neue Methode verbessert, wie Computer 3D-Modelle aus 2D-Bildern erstellen.
Chensheng Peng, Ido Sobol, Masayoshi Tomizuka
― 6 min Lesedauer
ModPrompt hilft Objekt-Erkennern, sich effektiv an neue Bilder anzupassen.
Heitor R. Medeiros, Atif Belal, Srikanth Muralidharan
― 6 min Lesedauer
Fortschritt bei der medizinischen Bildübersetzung für bessere Diagnosen und Patientenversorgung.
Anuja Vats, Ivar Farup, Marius Pedersen
― 8 min Lesedauer
Textaufforderungen in realistische Videos verwandeln, indem physikalische Gesetze einbezogen werden.
Qiyao Xue, Xiangyu Yin, Boyuan Yang
― 6 min Lesedauer
Neue Techniken verbessern 3D Gaussian Splatting für schnelleres Rendering.
Alex Hanson, Allen Tu, Geng Lin
― 5 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Bildwiederherstellung ohne umfangreiches Training.
Michail Dontas, Yutong He, Naoki Murata
― 6 min Lesedauer
Neue Methoden verbessern die Leistung und Effizienz bei multimodalen grossen Sprachmodellen.
Shiyu Zhao, Zhenting Wang, Felix Juefei-Xu
― 6 min Lesedauer
Ein neues System erzeugt realistische Videos mit logischen Bewegungsabläufen.
Tianshuo Xu, Zhifei Chen, Leyi Wu
― 8 min Lesedauer
KI-Videos verwischen die Realität und Täuschung und bringen Herausforderungen bei der Erkennung mit sich.
Matyas Bohacek, Hany Farid
― 6 min Lesedauer
Neue Methoden verbessern hyperspektrale Bildgebung für verschiedene Anwendungen in der realen Welt.
Chia-Ming Lee, Ching-Heng Cheng, Yu-Fan Lin
― 7 min Lesedauer
Lerne, wie neue Methoden die Erkennung von kleinen Objekten in 3D-Daten verbessern.
Chade Li, Pengju Zhang, Yihong Wu
― 7 min Lesedauer