FabuLight-ASD verbessert die Sprechererkennung, indem es Audio-, Video- und Körperbewegungsdaten kombiniert.
Hugo Carneiro, Stefan Wermter
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
FabuLight-ASD verbessert die Sprechererkennung, indem es Audio-, Video- und Körperbewegungsdaten kombiniert.
Hugo Carneiro, Stefan Wermter
― 5 min Lesedauer
DROID-Splat kombiniert Tracking und Mapping für eine bessere Roboternavigation.
Christian Homeyer, Leon Begiristain, Christoph Schnörr
― 5 min Lesedauer
Neues Tool SKAD verbessert die frühe Diagnose von Demenz und Alzheimer.
Yasmine Mustafa, Mohamed Elmahallawy, Tie Luo
― 8 min Lesedauer
HyperSeg verbessert die Segmentierung von Bildern und Videos mit verbessertem Denken und Interaktion.
Cong Wei, Yujie Zhong, Haoxian Tan
― 5 min Lesedauer
SpateGAN-ERA5 verbessert die Genauigkeit von Regendaten für bessere Vorhersagen.
Luca Glawion, Julius Polz, Harald Kunstmann
― 6 min Lesedauer
DGGS verbessert 3D-Modellierung, indem Ablenkungen im Hintergrund reduziert werden, für sauberere Visuals.
Yanqi Bao, Jing Liao, Jing Huo
― 7 min Lesedauer
Lern, wie synthetische Videos Computern helfen, Aktionen zu erkennen.
Davyd Svyezhentsev, George Retsinas, Petros Maragos
― 6 min Lesedauer
Ein schlaueres System zur Verfolgung von Objekten, das sich darauf konzentriert, Ablenkungen zu vermeiden.
Jovana Videnovic, Alan Lukezic, Matej Kristan
― 7 min Lesedauer
Lern, wie Computer Bilder erkennen, indem sie zwei wichtige Aufgaben nutzen.
Hoàng-Ân Lê, Paul Berg, Minh-Tan Pham
― 6 min Lesedauer
Neues Framework verbessert die Qualität von synthetischen medizinischen Bildern für bessere Diagnosen.
Anurag Shandilya, Swapnil Bhat, Akshat Gautam
― 8 min Lesedauer
AdcSR verbessert die Bildqualität schnell und effizient für klarere Ansichten.
Bin Chen, Gehui Li, Rongyuan Wu
― 6 min Lesedauer
Eine Methode, um spezifische Videoteile mithilfe von Textabsätzen zu finden.
Mengzhao Wang, Huafeng Li, Yafei Zhang
― 5 min Lesedauer
Der ABBG-Angriff stört visuelle Objekterkennungstracker, die auf Transformer-Technologie basieren.
Fatemeh Nourilenjan Nokabadi, Jean-Francois Lalonde, Christian Gagné
― 6 min Lesedauer
Neue Techniken helfen Robotern, sich während Aufgaben an verschiedene Lichtverhältnisse anzupassen.
Travis Davies, Jiahuan Yan, Xiang Chen
― 8 min Lesedauer
RTSR verbessert Videos mit schlechter Qualität für ein besseres Seherlebnis.
Yuxuan Jiang, Jakub Nawała, Chen Feng
― 5 min Lesedauer
Eine neue Methode zum Erstellen von Videos, die die Identität bewahren und die visuelle Qualität verbessern.
Shenghai Yuan, Jinfa Huang, Xianyi He
― 6 min Lesedauer
Verknüpfung geografischer Entitäten in historischen Karten mit modernen Techniken.
Xue Xia, Randall Balestriero, Tao Zhang
― 6 min Lesedauer
DRiVE revolutioniert, wie wir lebensechte 3D-Charaktere erstellen.
Mingze Sun, Junhao Chen, Junting Dong
― 8 min Lesedauer
Neues Tool MOAD-Net kombiniert DNA- und Gewebedaten für eine bessere Tumorklassifizierung.
Omnia Alwazzan, Amaya Gallagher-Syed, Thomas Millner
― 5 min Lesedauer
NumGrad-Pull stellt Oberflächen aus 3D-Punktwolken effizient mit mehr Detail wieder her.
Ruikai Cui, Shi Qiu, Jiawei Liu
― 8 min Lesedauer
Neue Benchmarks prüfen, wie gut Modelle Tiefenhinweise aus Bildern erfassen.
Duolikun Danier, Mehmet Aygün, Changjian Li
― 7 min Lesedauer
Eine Methode, um vorherzusagen, wo Leute laufen, mit weniger Daten.
Ryo Fujii, Hideo Saito, Ryo Hachiuma
― 8 min Lesedauer
Erfahre, wie DWCL die Datengruppierung durch Qualitätsansichten verbessert.
Zhihui Zhang, Xiaoshuai Hao, Hanning Yuan
― 5 min Lesedauer
Roboter lernen, menschliche Signale in schnellen Fussballspielen zu interpretieren.
Filippo Ansalone, Flavio Maiorana, Daniele Affinita
― 5 min Lesedauer
Eine neue Methode verbessert die Erkennung in Brust-CT-Scans.
Yuexing Ding, Jun Wang, Hongbing Lyu
― 6 min Lesedauer
MotionLLaMA synthetisiert und versteht Bewegung und verändert, wie wir mit Technologie interagieren.
Zeyu Ling, Bo Han, Shiyang Li
― 10 min Lesedauer
Ein frisches Soundsystem erkennt die Klangrichtungen und verbessert die Detektion in lauten Umgebungen.
Erik Tegler, Magnus Oskarsson, Kalle Åström
― 4 min Lesedauer
Autos könnten demnächst Fahrer mit Biometrie wie Gesicht und Stimme erkennen.
Vedrana Krivokuca Hahn, Jeremy Maceiras, Alain Komaty
― 6 min Lesedauer
Eine neuartige Methode verbessert die Leistung im Visuellen Fragenbeantworten, indem sie das Lernen strukturiert.
Ahmed Akl, Abdelwahed Khamis, Zhe Wang
― 10 min Lesedauer
PCNet verbessert die Bildqualität bei komprimierter Sensortechnik mit smarten Sampling-Techniken.
Bin Chen, Jian Zhang
― 7 min Lesedauer
Dieses System verbessert, wie wir kleine Objekte auf der Strasse überwachen.
Shahriar Soudeep, M. F. Mridha, Md Abrar Jahin
― 6 min Lesedauer
Neue Methode schätzt Kameraeinstellungen aus einem Bild für 3D-Anwendungen.
Junyuan Deng, Wei Yin, Xiaoyang Guo
― 5 min Lesedauer
Neue Methoden verbessern die Fehlererkennung in Industrieprodukten mit fortschrittlichen Modellen.
Hui-Yue Yang, Hui Chen, Ao Wang
― 7 min Lesedauer
Verbesserung der Segmentierung von Zahnstrukturen mit fortschrittlichen Bildgebungstechniken.
Fabian Isensee, Yannick Kirchhoff, Lars Kraemer
― 6 min Lesedauer
SelfSplat macht 3D-Modellierung einfacher, indem es Bilder ohne strenge Vorgaben nutzt.
Gyeongjin Kang, Jisang Yoo, Jihyeon Park
― 8 min Lesedauer
Verwandle statische Fotos in lebendige Animationen mit der neuesten PhysMotion-Technologie.
Xiyang Tan, Ying Jiang, Xuan Li
― 7 min Lesedauer
Wir erkunden die einfache Möglichkeit, Bilder durch Chatten zu generieren.
Chengyou Jia, Changliang Xia, Zhuohang Dang
― 6 min Lesedauer
Technologie kombinieren, um Rissdiagnose in Strassen, Brücken und Gebäuden zu verbessern.
Feng Ding
― 5 min Lesedauer
DOGE vereinfacht die Interaktion mit Dokumenten und macht Informationen zugänglich und verständlich.
Yinan Zhou, Yuxin Chen, Haokun Lin
― 7 min Lesedauer
Umgang mit schädlichen Online-Inhalten mit fortgeschrittenen Sprachmodellen.
Nouar AlDahoul, Myles Joshua Toledo Tan, Harishwar Reddy Kasireddy
― 7 min Lesedauer