MotionLLaMA synthetisiert und versteht Bewegung und verändert, wie wir mit Technologie interagieren.
Zeyu Ling, Bo Han, Shiyang Li
― 10 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
MotionLLaMA synthetisiert und versteht Bewegung und verändert, wie wir mit Technologie interagieren.
Zeyu Ling, Bo Han, Shiyang Li
― 10 min Lesedauer
Ein frisches Soundsystem erkennt die Klangrichtungen und verbessert die Detektion in lauten Umgebungen.
Erik Tegler, Magnus Oskarsson, Kalle Åström
― 4 min Lesedauer
Autos könnten demnächst Fahrer mit Biometrie wie Gesicht und Stimme erkennen.
Vedrana Krivokuca Hahn, Jeremy Maceiras, Alain Komaty
― 6 min Lesedauer
Eine neuartige Methode verbessert die Leistung im Visuellen Fragenbeantworten, indem sie das Lernen strukturiert.
Ahmed Akl, Abdelwahed Khamis, Zhe Wang
― 10 min Lesedauer
PCNet verbessert die Bildqualität bei komprimierter Sensortechnik mit smarten Sampling-Techniken.
Bin Chen, Jian Zhang
― 7 min Lesedauer
Dieses System verbessert, wie wir kleine Objekte auf der Strasse überwachen.
Shahriar Soudeep, M. F. Mridha, Md Abrar Jahin
― 6 min Lesedauer
Neue Methode schätzt Kameraeinstellungen aus einem Bild für 3D-Anwendungen.
Junyuan Deng, Wei Yin, Xiaoyang Guo
― 5 min Lesedauer
Neue Methoden verbessern die Fehlererkennung in Industrieprodukten mit fortschrittlichen Modellen.
Hui-Yue Yang, Hui Chen, Ao Wang
― 7 min Lesedauer
Verbesserung der Segmentierung von Zahnstrukturen mit fortschrittlichen Bildgebungstechniken.
Fabian Isensee, Yannick Kirchhoff, Lars Kraemer
― 6 min Lesedauer
SelfSplat macht 3D-Modellierung einfacher, indem es Bilder ohne strenge Vorgaben nutzt.
Gyeongjin Kang, Jisang Yoo, Jihyeon Park
― 8 min Lesedauer
Verwandle statische Fotos in lebendige Animationen mit der neuesten PhysMotion-Technologie.
Xiyang Tan, Ying Jiang, Xuan Li
― 7 min Lesedauer
Wir erkunden die einfache Möglichkeit, Bilder durch Chatten zu generieren.
Chengyou Jia, Changliang Xia, Zhuohang Dang
― 6 min Lesedauer
Technologie kombinieren, um Rissdiagnose in Strassen, Brücken und Gebäuden zu verbessern.
Feng Ding
― 5 min Lesedauer
DOGE vereinfacht die Interaktion mit Dokumenten und macht Informationen zugänglich und verständlich.
Yinan Zhou, Yuxin Chen, Haokun Lin
― 7 min Lesedauer
Umgang mit schädlichen Online-Inhalten mit fortgeschrittenen Sprachmodellen.
Nouar AlDahoul, Myles Joshua Toledo Tan, Harishwar Reddy Kasireddy
― 7 min Lesedauer
Wissenschaftler nutzen MRT-Technologie, um die Herzbewegung in drei Dimensionen darzustellen.
Meng Ye, Bingyu Xin, Bangwei Guo
― 8 min Lesedauer
ElectroVizQA testet, wie gut KI digitale Elektronik versteht, mit visuellen und textlichen Fragen.
Pragati Shuddhodhan Meshram, Swetha Karthikeyan, Bhavya
― 6 min Lesedauer
Entdecke, wie Steganographie Geheimnisse in Bildern mithilfe von Deep Learning sicher aufbewahrt.
Waheed Rehman
― 7 min Lesedauer
Ein Modell gibt Einblicke in die Vorhersage der frühen Gehirnentwicklung bei Säuglingen.
Patrick Styll, Dowon Kim, Jiook Cha
― 6 min Lesedauer
Optimierung der Erstellung von 3D-Eisenbahnmodellen mit moderner Technologie und freien Daten.
Mohamed S. H. Alabassy
― 6 min Lesedauer
Ein neuer Ansatz zur Verbesserung des Verständnisses von Verkehrsszenen für selbstfahrende Autos.
Changsheng Lv, Mengshi Qi, Liang Liu
― 7 min Lesedauer
Forscher stellen eine Methode zur verbesserten Änderungsdetektion in Bildern vor.
Yan Xing, Qi'ao Xu, Zongyu Guo
― 6 min Lesedauer
Wissenschaftler verbessern Unterwasserbilder für bessere Objekterkennung und enthüllen versteckte Schätze.
Ali Awad, Ashraf Saleem, Sidike Paheding
― 5 min Lesedauer
Entdecke, wie Geräuschmuster die Genauigkeit von Text-zu-Bild-Modellen verbessern können.
Shuangqi Li, Hieu Le, Jingyi Xu
― 10 min Lesedauer
Blätter können Bildverkennungssysteme in selbstfahrenden Autos verwirren.
Anthony Etim, Jakub Szefer
― 7 min Lesedauer
DiffMVR stellt Videos wieder her, indem es versteckte Details repariert und die Klarheit verbessert.
Zheyan Zhang, Diego Klabjan, Renee CB Manworren
― 7 min Lesedauer
Ein neues Framework verbessert die Leistung mit weniger markierten Bildern in der semantischen Segmentierung.
Daniel Morales-Brotons, Grigorios Chrysos, Stratis Tzoumas
― 7 min Lesedauer
Diese Methode vereinfacht das Erstellen von Match-Cuts für Filmemacher aller Levels.
Alejandro Pardo, Fabio Pizzati, Tong Zhang
― 5 min Lesedauer
Entdecke, wie besserer Kamera-Handling die Videoqualität und Kreativität steigert.
Sherwin Bahmani, Ivan Skorokhodov, Guocheng Qian
― 5 min Lesedauer
SimCMF hilft KI-Modellen, sich effizient mit diversen Bildern zu verbessern.
Chenyang Lei, Liyi Chen, Jun Cen
― 5 min Lesedauer
Ein klarer Blick darauf, lange Videos in überschaubare Häppchen zu erstellen.
Siyang Zhang, Ser-Nam Lim
― 6 min Lesedauer
Eine neue Methode, um 3D-Modelle schnell und ressourcensparend zu trainieren.
Hao Liu, Minglin Chen, Yanni Ma
― 7 min Lesedauer
Das STU-Net Modell zeigt vielversprechende Ansätze, um CT-Scan-Wissen auf andere Bildgebungsverfahren anzuwenden.
Jin Ye, Ying Chen, Yanjun Li
― 6 min Lesedauer
Forschung konzentriert sich darauf, 3D-Bilder mit menschlicher Sprache zu verknüpfen, um schlauere Interaktionen zu ermöglichen.
Hao Liu, Yanni Ma, Yan Liu
― 7 min Lesedauer
Erforsche die Wissenschaft hinter der Videoerstellung mit Spatiotemporal Skip Guidance.
Junha Hyung, Kinam Kim, Susung Hong
― 7 min Lesedauer
Eine neue Methode verbessert verschwommene Bilder mit fortschrittlichen Bildverarbeitungstechniken.
Li-Yuan Tsao, Hao-Wei Chen, Hao-Wei Chung
― 8 min Lesedauer
Neue Methode reduziert Fehler bei der KI-Bildanalyse und bei der Generierung von Antworten.
Yudong Zhang, Ruobing Xie, Jiansheng Chen
― 4 min Lesedauer
HDI-Former kombiniert traditionelle und Event-Kameras für bessere Objekterkennung.
Dianze Li, Jianing Li, Xu Liu
― 5 min Lesedauer
Ein neues KI-System soll die Erkennung von Gehirntumoren im MRI verbessern.
Lan Jiang, Yuchao Zheng, Miao Yu
― 6 min Lesedauer
Entdecke, wie Texturierte Gaussis den Realismus in Videospielen und Filmen verbessern.
Brian Chao, Hung-Yu Tseng, Lorenzo Porzi
― 6 min Lesedauer