Un nuevo modelo enseña a las computadoras a entender imágenes usando lenguaje natural.
Cong Wei, Yujie Zhong, Haoxian Tan
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo modelo enseña a las computadoras a entender imágenes usando lenguaje natural.
Cong Wei, Yujie Zhong, Haoxian Tan
― 8 minilectura
Los investigadores abordan la alucinación de objetos en la IA para mejorar la precisión y fiabilidad.
Le Yang, Ziwei Zheng, Boxu Chen
― 7 minilectura
VIAP ofrece una solución para engañar a los sistemas de reconocimiento de IA desde diferentes ángulos.
Christian Green, Mehmet Ergezer, Abdurrahman Zeybey
― 9 minilectura
Aprende a alinear vistas 3D para visualizaciones precisas.
Jiaqi Yang, Chu'ai Zhang, Zhengbao Wang
― 6 minilectura
Aprende cómo las computadoras pueden reconocer objetos con ejemplos limitados.
Kun Yan, Zied Bouraoui, Fangyun Wei
― 6 minilectura
Técnicas para mejorar la eficiencia de las CNN en dispositivos con recursos limitados.
Muhammad Sohail Ibrahim, Muhammad Usman, Jeong-A Lee
― 7 minilectura
GAGS revoluciona la manera en que interpretamos escenas 3D a partir de imágenes 2D.
Yuning Peng, Haiping Wang, Yuan Liu
― 7 minilectura
Los investigadores mejoran la capacidad de la IA para interpretar imágenes a través de mejores datos de entrenamiento.
Austin Stone, Hagen Soltau, Robert Geirhos
― 9 minilectura
Un nuevo marco mejora el análisis de imágenes médicas usando datos etiquetados y no etiquetados.
Meghana Karri, Amit Soni Arya, Koushik Biswas
― 9 minilectura
APT mejora el reconocimiento de imágenes y texto con ejemplos limitados.
Eric Brouwer, Jan Erik van Woerden, Gertjan Burghouts
― 8 minilectura
ScatSpotter ofrece un gran conjunto de datos para mejorar la detección de caca de perro en imágenes.
Jon Crall
― 7 minilectura
Aprende cómo los algoritmos de agrupamiento simplifican el análisis de datos y revelan patrones ocultos.
Guy B. Oldaker, Maria Emelianenko
― 9 minilectura
La investigación muestra cómo engañar a los sistemas de detección de vehículos de manera efectiva.
Mikael Yeghiazaryan, Sai Abhishek Siddhartha Namburu, Emily Kim
― 7 minilectura
Aprende cómo la incertidumbre mejora la superresolución en la visión por computadora para tener imágenes más claras.
Maniraj Sai Adapa, Marco Zullich, Matias Valdenegro-Toro
― 7 minilectura
Un marco unificado para tareas de visión por computadora eficientes usando datos mínimos.
Bharadwaj Ravichandran, Alexander Lynch, Sarah Brockman
― 9 minilectura
Los modelos aprenden objetos viejos y nuevos mientras recuerdan lo que ya saben.
Bowen Dong, Zitong Huang, Guanglei Yang
― 7 minilectura
Watertox altera imágenes de manera astuta para confundir a los sistemas de IA mientras sigue siendo clara para los humanos.
Zhenghao Gao, Shengjie Xu, Meixi Chen
― 10 minilectura
Explorando cómo los sistemas recurrentes pueden mejorar el rendimiento de la segmentación de imágenes.
David Calhas, João Marques, Arlindo L. Oliveira
― 7 minilectura
STTrack mejora el seguimiento de objetos al combinar múltiples fuentes de datos para mayor precisión.
Xiantao Hu, Ying Tai, Xu Zhao
― 9 minilectura
NeSyCoCo mejora la capacidad de la IA para conectar el lenguaje y las visuales de manera efectiva.
Danial Kamali, Elham J. Barezi, Parisa Kordjamshidi
― 8 minilectura
El modelo CICLD mejora la segmentación semántica, cerrando la brecha entre imágenes sintéticas y del mundo real.
Jongmin Yu, Zhongtian Sun, Shan Luo
― 10 minilectura
Un enfoque fresco para mejorar conjuntos de datos de imágenes usando la ayuda de humanos.
Changjian Chen, Fei Lv, Yalong Guan
― 7 minilectura
Sistema revolucionario que rastrea animales en tiempo real en diferentes entornos.
Vincent Coulombe, David-Alexandre Roussel, Mohamad Sadegh Monfared
― 7 minilectura
La investigación muestra que las redes de convolución por profundidad mantienen filtros generales en diferentes tareas.
Zahra Babaiee, Peyman M. Kiasari, Daniela Rus
― 8 minilectura
Nuevos métodos mejoran el reconocimiento de objetos en diferentes condiciones climáticas usando datos sintéticos.
Javier Montalvo, Roberto Alcover-Couso, Pablo Carballeira
― 7 minilectura
Descubre cómo la tecnología ayuda a los investigadores a rastrear aves en aviarios.
Keon Moradi, Ethan Haque, Jasmeen Kaur
― 8 minilectura
Un nuevo método mejora el rendimiento del reconocimiento de imágenes con una gestión inteligente de tokens.
Seungdong Yoa, Seungjun Lee, Hyeseung Cho
― 7 minilectura
Aprende cómo mejorar la fiabilidad de los clasificadores de imágenes frente a distorsiones.
Dang Nguyen, Sunil Gupta, Kien Do
― 8 minilectura
Un nuevo método que acelera el entrenamiento de deep learning sin hacer cambios importantes.
Evgeny Hershkovitch Neiterman, Gil Ben-Artzi
― 7 minilectura
Descubre cómo una sola foto puede crear un modelo facial 3D detallado.
Weijie Lyu, Yi Zhou, Ming-Hsuan Yang
― 7 minilectura
Un nuevo sistema rastrea objetos utilizando múltiples vistas y descripciones.
Sijia Chen, En Yu, Wenbing Tao
― 8 minilectura
Un método innovador conecta el lenguaje con el reconocimiento de escenas en 3D para máquinas más inteligentes.
Hao Li, Roy Qin, Zhengyu Zou
― 7 minilectura
Un enfoque de dos etapas aborda la eliminación de sombras en las imágenes, mejorando el reconocimiento de objetos.
Jiamin Xu, Yuxin Zheng, Zelong Li
― 7 minilectura
CoSurfGS ofrece un nuevo enfoque para la reconstrucción 3D usando trabajo en equipo entre dispositivos.
Yuanyuan Gao, Yalun Dai, Hao Li
― 8 minilectura
Un nuevo método mejora el realismo en escenas 3D interiores.
Zixi Liang, Guowei Xu, Haifeng Wu
― 7 minilectura
Aprende cómo la incertidumbre influye en la detección de objetos y el desarrollo de modelos.
M. Tahasanul Ibrahim, Rifshu Hussain Shaik, Andreas Schwung
― 9 minilectura
Aprende cómo los modelos 3D mejoran la estimación de orientación de objetos para aplicaciones tecnológicas.
Zehan Wang, Ziang Zhang, Tianyu Pang
― 8 minilectura
Los investigadores piden un cambio hacia evaluaciones de múltiples etiquetas en visión por computadora.
Esla Timothy Anzaku, Seyed Amir Mousavi, Arnout Van Messem
― 8 minilectura
Descubre cómo los modelos de lenguaje visual mejoran la comprensión de imágenes y texto.
Tenghui Li, Guoxu Zhou, Xuyang Zhao
― 9 minilectura
Descubre cómo CDCTW mejora la alineación de datos para diferentes campos.
Afek Steinberg, Ran Eisenberg, Ofir Lindenbaum
― 6 minilectura