Eine neue Methode verringert den Datenbedarf für das Training von Robotern mit visuellen Demonstrationen.
Zichen Jeff Cui, Hengkai Pan, Aadhithya Iyer
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine neue Methode verringert den Datenbedarf für das Training von Robotern mit visuellen Demonstrationen.
Zichen Jeff Cui, Hengkai Pan, Aadhithya Iyer
― 6 min Lesedauer
Ein neues Framework integriert Bundle-Adjustment mit PyTorch für bessere 3D-Modellierung.
Zitong Zhan, Huan Xu, Zihang Fang
― 6 min Lesedauer
Neue Techniken verbessern die Vorhersagen zur Verfügbarkeit von Solarenergie anhand von Himmelbildern.
Leron Julian, Aswin C. Sankaranarayanan
― 6 min Lesedauer
Ein neues Verfahren kombiniert Audio und Gesichtsausdrücke für die realistische Videogenerierung.
Sai Tanmay Reddy Chakkera, Aggelina Chatziagapi, Dimitris Samaras
― 7 min Lesedauer
MoRAG verbessert die menschliche Bewegungsproduktion aus Textbeschreibungen mithilfe von teil-spezifischer Abrufung.
Kalakonda Sai Shashank, Shubh Maheshwari, Ravi Kiran Sarvadevabhatla
― 5 min Lesedauer
Die Verbesserung der Effizienz von Modellen in der Fernerkundung durch Wissensdestillationstechniken.
Yassine Himeur, Nour Aburaed, Omar Elharrouss
― 6 min Lesedauer
Neue Methoden verbessern die Trennung von Messungen der Meeresspiegelhöhe für eine bessere Analyse der Ozeandynamik.
Jingwen Lyu, Yue Wang, Christian Pedersen
― 6 min Lesedauer
WaveMixSR-V2 verwandelt Bilder mit niedriger Auflösung effizient in hochwertige Ausgaben.
Pranav Jeevan, Neeraj Nixon, Amit Sethi
― 5 min Lesedauer
Wir stellen PAD-FT vor, eine leichte Methode, um Backdoor-Angriffe ohne saubere Daten zu bekämpfen.
Yukai Xu, Yujie Gu, Kouichi Sakurai
― 6 min Lesedauer
Dieses Paper vergleicht Vision Transformers und CNNs zur Klassifizierung von Seitenstrahlsonar Bildern.
BW Sheffield, Jeffrey Ellen, Ben Whitmore
― 6 min Lesedauer
LEMON ermöglicht effizientes Bearbeiten von 3D-Meshes durch Benutzereingaben und fortgeschrittene Techniken.
Furkan Mert Algan, Umut Yazgan, Driton Salihu
― 5 min Lesedauer
Eine neue Methode verbessert das 3D-Modellieren von natürlichen Oberflächen mithilfe von begrenzten Satellitenbildern.
Lulin Zhang, Ewelina Rupnik, Tri Dung Nguyen
― 8 min Lesedauer
ChefFusion kombiniert mehrere foodbezogene Aufgaben durch moderne Technologie.
Peiyu Li, Xiaobao Huang, Yijun Tian
― 5 min Lesedauer
Eine neue Methode verbessert, wie Roboter zukünftige Szenen und Objektinteraktionen vorhersagen.
Juana Valeria Hurtado, Riya Mohan, Abhinav Valada
― 6 min Lesedauer
Ein neuer Dual-Path-Ansatz verbessert die Objekterkennung für Roboter in schwierigen Umgebungen.
Aneesh Chavan, Vaibhav Agrawal, Vineeth Bhat
― 6 min Lesedauer
Eine neue Methode verbessert die Bildregistrierung während der Neurochirurgie.
Maximilian Fehrentz, Mohammad Farid Azampour, Reuben Dorent
― 5 min Lesedauer
Eine neue Methode verbessert 3D-Kopfmodelle für mehr Realismus und Leistung.
Kartik Teotia, Hyeongwoo Kim, Pablo Garrido
― 7 min Lesedauer
StableMamba verbessert die Bild- und Videoverarbeitung mit mehr Robustheit und Performance.
Hamid Suleman, Syed Talal Wasim, Muzammal Naseer
― 6 min Lesedauer
Eine neue Methode verbessert die Schätzung des Kameraorts unter schwierigen Licht- und Oberflächenbedingungen.
Lei Cheng, Junpeng Hu, Haodong Yan
― 5 min Lesedauer
Neue Methoden konzentrieren sich auf die Gesichtssymmetrie, um die Erkennungsgenauigkeit zu verbessern.
Pritesh Prakash, Koteswar Rao Jerripothula, Ashish Jacob Sam
― 6 min Lesedauer
Untersuchen, wie 2D- und 3D-Gesten die Kommunikation von virtuellen Charakteren beeinflussen.
Téo Guichoux, Laure Soulier, Nicolas Obin
― 7 min Lesedauer
Neue Methoden sollen die Analyse von latenten Fingerabdrücken für kriminaltechnische Ermittlungen verbessern.
Abdul Wahab, Tariq Mahmood Khan, Shahzaib Iqbal
― 5 min Lesedauer
Eine neue Methode verbessert das Lernen von neuen Klassen mit begrenzten Daten.
Ye Wang, Yaxiong Wang, Guoshuai Zhao
― 8 min Lesedauer
RockTrack verbessert das 3D-Objekttracking mit Flexibilität und Genauigkeit in verschiedenen Umgebungen.
Xiaoyu Li, Peidong Li, Lijun Zhao
― 5 min Lesedauer
Eine Technik, die Text- und Bildaufforderungen kombiniert, um präzise Bildbearbeitungen zu machen.
Yan Zheng, Lemeng Wu
― 5 min Lesedauer
AR-Technologie verbessert die Visualisierung und Nachverfolgung bei komplexen chirurgischen Eingriffen.
Jingwei Song, Ray Zhang, Wenwei Zhang
― 5 min Lesedauer
Hi-NeuS erleichtert das Erstellen von 3D-Modellen aus Bildern, die mit Handykameras aufgenommen wurden.
Haotian Bai, Yize Chen, Lin Wang
― 6 min Lesedauer
Pool Skip hilft tiefen Netzwerken, indem es Eliminierungsingularitäten während des Trainings angeht.
Chengkun Sun, Jinqian Pan, Juoli Jin
― 8 min Lesedauer
Neues Konzept bewertet die Nützlichkeit von Bildmerkmalen für verbesserte Computer Vision-Aufgaben.
Yash Turkar, Timothy Chase, Christo Aluckal
― 6 min Lesedauer
Eine neue Methode für bessere Tabellenkennung in der digitalen Datenverarbeitung.
Zhenrong Zhang, Shuhang Liu, Pengfei Hu
― 4 min Lesedauer
Eine neue Methode verbessert die Datenbereinigung für Unterwassermapping-Tools.
Li Ling, Yiping Xie, Nils Bore
― 6 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Klassifiziererleistung bei komplexen Daten.
Chengkun Sun, Jinqian Pan, Russell Stevens Terry
― 5 min Lesedauer
Eine neue leichte Methode für visuelle-inertiale Odometry verbessert die Leistung in schwierigen Umgebungen.
Jinho Park, Se Young Chun, Mingoo Seok
― 6 min Lesedauer
Die Forschung konzentriert sich darauf, die Fähigkeit von KI zu verbessern, Aktionen in Videos zu erkennen.
Anastasia Anichenko, Frank Guerin, Andrew Gilbert
― 6 min Lesedauer
Neue Methode nutzt Gesichtsbewegungen, um die Konzentration von Schülern während des Online-Unterrichts zu beurteilen.
Aimar Silvan Ortubay, Lucas C. Parra, Jens Madsen
― 6 min Lesedauer
KI hilft dabei, synthetische CTA-Bilder aus TOF-MRA-Scans zu erstellen, was die Diagnose verbessert.
Alexander Koch, Orhun Utku Aydin, Adam Hilbert
― 6 min Lesedauer
MGSO verbessert die Echtzeit-Kartierung und Lokalisierung für Roboter mit Hilfe von Einzelkamera-Technologie.
Yan Song Hu, Nicolas Abboud, Muhammad Qasim Ali
― 6 min Lesedauer
Untersuchen der Rolle von LMMs bei der Transformation von Suchfähigkeiten mit Text und Bildern.
Dongzhi Jiang, Renrui Zhang, Ziyu Guo
― 7 min Lesedauer
Eine neue Technik verbessert den Realismus von Bildern, indem sie Farbwiedergabe und Formdarstellung entkopplet.
Victor Rong, Jingxiang Chen, Sherwin Bahmani
― 5 min Lesedauer
JourneyBench testet KI-Modelle mit ungewöhnlichen und fiktiven Bildern.
Zhecan Wang, Junzhang Liu, Chia-Wei Tang
― 8 min Lesedauer