VALO optimiert die LiDAR-Erkennung für autonome Fahrzeuge und bringt Geschwindigkeit und Genauigkeit in Einklang.
Ahmet Soyyigit, Shuochao Yao, Heechul Yun
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
VALO optimiert die LiDAR-Erkennung für autonome Fahrzeuge und bringt Geschwindigkeit und Genauigkeit in Einklang.
Ahmet Soyyigit, Shuochao Yao, Heechul Yun
― 6 min Lesedauer
Neueste Artikel
Wenliang Dai, Nayeon Lee, Boxin Wang
― 6 min Lesedauer
Fatema-E- Jannat, Sina Gholami, Jennifer I. Lim
― 8 min Lesedauer
Ziyang Yan, Wenzhen Dong, Yihua Shao
― 5 min Lesedauer
Shitao Xiao, Yueze Wang, Junjie Zhou
― 6 min Lesedauer
Alexey Kravets, Vinay Namboodiri
― 6 min Lesedauer
LPT++ verbessert die Objekterkennung in Klassen mit wenigen Beispielen durch fortschrittliche Techniken.
Bowen Dong, Pan Zhou, Wangmeng Zuo
― 7 min Lesedauer
Ein neues Framework verbessert die Segmentierung mit wenigen Beispielen.
Amirreza Fateh, Mohammad Reza Mohammadi, Mohammad Reza Jahed Motlagh
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit bei der Erkennung von Aortenstenosen durch maschinelles Lernen.
Ang Nan Gu, Michael Tsang, Hooman Vaseli
― 6 min Lesedauer
SLAck bietet einen neuen Ansatz, um verschiedene Objekte in Videos zu verfolgen.
Siyuan Li, Lei Ke, Yung-Hsu Yang
― 6 min Lesedauer
Ein Benchmark für die verallgemeinerte Few-Shot-Segmentierung in der Fernerkundung wird vorgestellt.
Clifford Broni-Bediako, Junshi Xia, Jian Song
― 5 min Lesedauer
Eine neue Methode kombiniert Video, Audio und Algorithmen für bessere Anomalieerkennung.
Yuta Kaneko, Abu Saleh Musa Miah, Najmul Hassan
― 7 min Lesedauer
Ein Blick auf Score Forgetting Distillation und seinen Einfluss auf generative KI.
Tianqi Chen, Shujian Zhang, Mingyuan Zhou
― 6 min Lesedauer
SplatFields verbessert 3D-Bilder von eingeschränkten Kamerasichten und steigert die Details und Qualität.
Marko Mihajlovic, Sergey Prokudin, Siyu Tang
― 7 min Lesedauer
Einsatz von synthetischen Daten zur Verbesserung von Mobilitätswerkzeugen für blinde und sehbehinderte Menschen.
Hochul Hwang, Krisha Adhikari, Satya Shodhaka
― 7 min Lesedauer
Dieser Artikel bewertet die Zuverlässigkeit von MIL-Modellen in klinischen Anwendungen.
Hassan Keshvarikhojasteh
― 5 min Lesedauer
Eine neue Methode verbessert die Pose-Schätzung mit RGB-Bildern, die durch Tiefendaten unterstützt werden.
Alessandro Simoni, Francesco Marchetti, Guido Borghi
― 6 min Lesedauer
OneEncoder verbindet Bilder, Text, Audio und Video effizient für eine bessere Informationsverarbeitung.
Bilal Faye, Hanane Azzag, Mustapha Lebbah
― 7 min Lesedauer
Neue Methoden verbessern die Genauigkeit und Effizienz beim Erkennen ähnlicher Objekte.
Edwin Arkel Rios, Femiloye Oyerinde, Min-Chun Hu
― 5 min Lesedauer
Lern, wie man Bilder effektiv bewertet und vergleicht.
Gautier Dagan, Olga Loginova, Anil Batra
― 5 min Lesedauer
Dieses Modell verbessert das AI-Lernen, während es das vergangene Wissen behält.
Min-Yeong Park, Jae-Ho Lee, Gyeong-Moon Park
― 6 min Lesedauer
Ein neues System verbessert die Sicherheitsvorhersagen für autonome Fahrzeuge in herausfordernden Umgebungen.
Manthan Patel, Jonas Frey, Deegan Atha
― 7 min Lesedauer
KALE nutzt Metadaten, um aussagekräftige Beschreibungen für Kunstwerke zu erstellen.
Yanbei Jiang, Krista A. Ehinger, Jey Han Lau
― 7 min Lesedauer
TrajSSL verbessert die 3D-Objekterkennung mit weniger gelabelten Daten durch Bewegungsprognose.
Philip Jacobson, Yichen Xie, Mingyu Ding
― 7 min Lesedauer
Erforschen, wie LLMs das Denken bei verschiedenen Datentypen verbessern.
Shengsheng Qian, Zuyi Zhou, Dizhan Xue
― 8 min Lesedauer
Entdecke, wie FlexiTex die 3D-Texturerstellung durch visuelle Anleitung verbessert.
DaDong Jiang, Xianghui Yang, Zibo Zhao
― 6 min Lesedauer
Neues Modell verbessert die Genauigkeit der Klassifikation von Hautläsionen durch die Verwendung mehrerer Datentypen.
Yuan Zhang, Yutong Xie, Hu Wang
― 5 min Lesedauer
Ein neuer Rahmen schätzt die Tiefe präzise aus einzelnen unscharfen Bildern.
Jinchang Zhang, Ningning Xu, Hao Zhang
― 6 min Lesedauer
Eine Studie zeigt Leistungsunterschiede bei RIdV-Systemen in verschiedenen Bevölkerungsgruppen.
Kaniz Fatima, Michael Schuckers, Gerardo Cruz-Ortiz
― 5 min Lesedauer
Transformers verbessern die Klassifikationsgenauigkeit für Autismus-Spektrum-Störung durch fortschrittliche Bildanalyse des Gehirns.
Yinchi Zhou, Peiyu Duan, Yuexi Du
― 7 min Lesedauer
GCA-SUN verbessert das Zählen von Objekten in Bildern ohne beschriftete Beispiele.
Yuzhe Wu, Yipeng Xu, Tianyu Xu
― 6 min Lesedauer
Eine neue Methode verringert den Datenbedarf für das Training von Robotern mit visuellen Demonstrationen.
Zichen Jeff Cui, Hengkai Pan, Aadhithya Iyer
― 6 min Lesedauer
Ein neues Framework integriert Bundle-Adjustment mit PyTorch für bessere 3D-Modellierung.
Zitong Zhan, Huan Xu, Zihang Fang
― 6 min Lesedauer
Neue Techniken verbessern die Vorhersagen zur Verfügbarkeit von Solarenergie anhand von Himmelbildern.
Leron Julian, Aswin C. Sankaranarayanan
― 6 min Lesedauer
Ein neues Verfahren kombiniert Audio und Gesichtsausdrücke für die realistische Videogenerierung.
Sai Tanmay Reddy Chakkera, Aggelina Chatziagapi, Dimitris Samaras
― 7 min Lesedauer
MoRAG verbessert die menschliche Bewegungsproduktion aus Textbeschreibungen mithilfe von teil-spezifischer Abrufung.
Kalakonda Sai Shashank, Shubh Maheshwari, Ravi Kiran Sarvadevabhatla
― 5 min Lesedauer
Die Verbesserung der Effizienz von Modellen in der Fernerkundung durch Wissensdestillationstechniken.
Yassine Himeur, Nour Aburaed, Omar Elharrouss
― 6 min Lesedauer
Neue Methoden verbessern die Trennung von Messungen der Meeresspiegelhöhe für eine bessere Analyse der Ozeandynamik.
Jingwen Lyu, Yue Wang, Christian Pedersen
― 6 min Lesedauer
WaveMixSR-V2 verwandelt Bilder mit niedriger Auflösung effizient in hochwertige Ausgaben.
Pranav Jeevan, Neeraj Nixon, Amit Sethi
― 5 min Lesedauer
Wir stellen PAD-FT vor, eine leichte Methode, um Backdoor-Angriffe ohne saubere Daten zu bekämpfen.
Yukai Xu, Yujie Gu, Kouichi Sakurai
― 6 min Lesedauer
Dieses Paper vergleicht Vision Transformers und CNNs zur Klassifizierung von Seitenstrahlsonar Bildern.
BW Sheffield, Jeffrey Ellen, Ben Whitmore
― 6 min Lesedauer
LEMON ermöglicht effizientes Bearbeiten von 3D-Meshes durch Benutzereingaben und fortgeschrittene Techniken.
Furkan Mert Algan, Umut Yazgan, Driton Salihu
― 5 min Lesedauer
Eine neue Methode verbessert das 3D-Modellieren von natürlichen Oberflächen mithilfe von begrenzten Satellitenbildern.
Lulin Zhang, Ewelina Rupnik, Tri Dung Nguyen
― 8 min Lesedauer
ChefFusion kombiniert mehrere foodbezogene Aufgaben durch moderne Technologie.
Peiyu Li, Xiaobao Huang, Yijun Tian
― 5 min Lesedauer
Eine neue Methode verbessert, wie Roboter zukünftige Szenen und Objektinteraktionen vorhersagen.
Juana Valeria Hurtado, Riya Mohan, Abhinav Valada
― 6 min Lesedauer
Ein neuer Dual-Path-Ansatz verbessert die Objekterkennung für Roboter in schwierigen Umgebungen.
Aneesh Chavan, Vaibhav Agrawal, Vineeth Bhat
― 6 min Lesedauer