Plane2Depth mejora la estimación de profundidad en escenas complejas, enfrentando los desafíos de baja textura.
Li Liu, Ruijie Zhu, Jiacheng Deng
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Plane2Depth mejora la estimación de profundidad en escenas complejas, enfrentando los desafíos de baja textura.
Li Liu, Ruijie Zhu, Jiacheng Deng
― 7 minilectura
Esta investigación mejora la estimación de profundidad en robots usando meta-aprendizaje para un mejor rendimiento en diferentes entornos.
Cho-Ying Wu, Yiqi Zhong, Junying Wang
― 6 minilectura
Un nuevo método y conjunto de datos para el análisis automatizado de células en la investigación del cerebro.
Valentina Vadori, Jean-Marie Graïc, Antonella Peruffo
― 6 minilectura
Un nuevo enfoque para crear imágenes sintéticas de manera eficiente para la destilación de conjuntos de datos.
Zhe Li, Weitong Zhang, Sarah Cechnicka
― 10 minilectura
MVTN mejora el reconocimiento de gestos de la mano a través de técnicas multiescala innovadoras.
Mallika Garg, Debashis Ghosh, Pyari Mohan Pradhan
― 6 minilectura
Este estudio evalúa varios modelos visuales para entender escenas 3D complejas.
Yunze Man, Shuhong Zheng, Zhipeng Bao
― 10 minilectura
Este estudio evalúa modelos de aprendizaje automático para detectar basura en los ríos.
Marga Don, Stijn Pinson, Blanca Guillen Cebrian
― 6 minilectura
Un nuevo método mejora la reconstrucción de superficies a partir de imágenes escasas, asegurando detalle y eficiencia.
Rui Peng, Shihe Shen, Kaiqiang Xiong
― 7 minilectura
Explorando los beneficios de la Representación Discreta Agrupada Organizada en el procesamiento de imágenes.
Rongzhen Zhao, Vivienne Wang, Juho Kannala
― 8 minilectura
Un nuevo método mejora la precisión de segmentación usando los modelos SAM y CLIP.
Xi Chen, Haosen Yang, Sheng Jin
― 6 minilectura
El nuevo modelo LowFormer mejora la velocidad y precisión para tareas visuales.
Moritz Nottebaum, Matteo Dunnhofer, Christian Micheloni
― 7 minilectura
El nuevo método LM-Gaussian genera modelos 3D detallados usando imágenes de entrada limitadas.
Hanyang Yu, Xiaoxiao Long, Ping Tan
― 7 minilectura
Un nuevo método mejora la claridad en imágenes oscuras usando redes neuronales innovadoras.
Aoxiang Ning, Minglong Xue, Jinhong He
― 6 minilectura
Un nuevo método permite una conversión más fácil de las ANNs a SNNs con menos consumo de energía.
Tong Bu, Maohua Li, Zhaofei Yu
― 9 minilectura
Nuevo conjunto de datos mejora el seguimiento de múltiples objetos en condiciones difíciles de video.
Friedhelm Hamann, Hanxiong Li, Paul Mieske
― 7 minilectura
VILA-U integra tareas de video, imagen y lenguaje en un solo marco.
Yecheng Wu, Zhuoyang Zhang, Junyu Chen
― 7 minilectura
Un nuevo enfoque para mejorar la detección de acciones en videos usando una capa TAG novedosa.
Aglind Reka, Diana Laura Borza, Dominick Reilly
― 6 minilectura
Un nuevo método mejora la precisión para localizar objetos a partir de imágenes.
Ting-Ru Liu, Hsuan-Kung Yang, Jou-Min Liu
― 5 minilectura
Un nuevo marco que mejora la comprensión de imágenes y texto juntos.
Yi Zhu, Yanpeng Zhou, Chunwei Wang
― 11 minilectura
Usando IRT para una evaluación más profunda del rendimiento del modelo de visión por computadora.
Rahul Ramachandran, Tejal Kulkarni, Charchit Sharma
― 7 minilectura
HOGraspNet ofrece datos valiosos para estudiar las interacciones entre manos y objetos en robótica y visión por computadora.
Woojin Cho, Jihyun Lee, Minjae Yi
― 7 minilectura
Este trabajo mejora los modelos de visión-lenguaje a través de mejores estrategias de datos y técnicas innovadoras.
Yuan Liu, Zhongyin Zhao, Ziyuan Zhuang
― 8 minilectura
Un método que mejora la CNN para enfocarse en áreas clave de la imagen para tomar mejores decisiones.
Lars Nieradzik, Henrike Stephani, Janis Keuper
― 5 minilectura
Un modelo que distingue imágenes reales de las generadas por computadora.
Preetu Mehta, Aman Sagar, Suchi Kumari
― 6 minilectura
Un nuevo método mejora la clasificación de videos al optimizar la selección de fotogramas.
Junho Lee, Jeongwoo Shin, Seung Woo Ko
― 9 minilectura
Un método estructurado para etiquetar imágenes y datos con precisión usando el modelo de flujo sigma.
Jonas Cassel, Bastian Boll, Stefania Petra
― 6 minilectura
Te presento PIP, una herramienta para detectar ataques adversariales en LVLMs.
Yudong Zhang, Ruobing Xie, Jiansheng Chen
― 6 minilectura
Un nuevo método mejora la identificación de objetos en imágenes mediante una integración visual y textual personalizada.
Ruilin Yao, Shengwu Xiong, Yichen Zhao
― 6 minilectura
Un nuevo método mejora la detección de carreteras usando diversas fuentes de datos.
Tao Ni, Xin Zhan, Tao Luo
― 7 minilectura
Nuevos métodos mejoran la estimación de profundidad usando imágenes individuales a través de una mejor augmentación de datos.
Nischal Khanal, Shivanand Venkanna Sheshappanavar
― 8 minilectura
Nuevo método mejora la calidad de nubes de puntos con funciones de pérdida ponderadas.
Fangzhou Lin, Haotian Liu, Haoying Zhou
― 8 minilectura
RPP mejora el ajuste y la generalización en Modelos de Visión-Lenguaje usando indicaciones refinadas.
Zhenyuan Chen, Lingfeng Yang, Shuo Chen
― 9 minilectura
Este método mejora los conjuntos de datos de entrenamiento para un mejor rendimiento en la segmentación de imágenes.
Quang-Huy Che, Duc-Tri Le, Vinh-Tiep Nguyen
― 7 minilectura
Un estudio compara las habilidades humanas y de IA para reconocer formas 3D desde diferentes ángulos.
Tyler Bonnen, Stephanie Fu, Yutong Bai
― 7 minilectura
Examinando cómo los modelos de visión por computadora pueden alinearse con la comprensión visual humana.
Mohammad-Javad Darvishi-Bayazi, Md Rifat Arefin, Jocelyn Faubert
― 7 minilectura
Nuevo método mejora el aprendizaje continuo en detección de objetos.
Riccardo De Monte, Davide Dalle Pezze, Marina Ceccon
― 9 minilectura
Un nuevo conjunto de datos tiene como objetivo mejorar los métodos de detección de morphing facial.
Haoyu Zhang, Raghavendra Ramachandra, Kiran Raja
― 8 minilectura
Una mirada a las mejoras y desafíos en la navegación de máquinas usando visión y lenguaje.
Xuesong Zhang, Jia Li, Yunbo Xu
― 5 minilectura
Un nuevo marco mejora la detección de objetos al identificar instancias fuera de distribución usando prototipos.
Junkun Chen, Jilin Mei, Liang Chen
― 7 minilectura
KRONC ofrece un método rápido para estimar posiciones de cámaras usando puntos clave en vehículos.
Davide Di Nucci, Alessandro Simoni, Matteo Tomei
― 6 minilectura