Una inmersión profunda en cómo las computadoras identifican las acciones humanas con objetos.
Mingda Jia, Liming Zhao, Ge Li
― 8 minilectura
New Science Research Articles Everyday
Una inmersión profunda en cómo las computadoras identifican las acciones humanas con objetos.
Mingda Jia, Liming Zhao, Ge Li
― 8 minilectura
Descubre cómo las ilusiones visuales impactan los modelos de VQA y su rendimiento.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 7 minilectura
Los robots pueden aprender a través de conversaciones, mejorando sus habilidades y adaptabilidad.
Jonghyuk Park, Alex Lascarides, Subramanian Ramamoorthy
― 6 minilectura
Descubre cómo GenEx transforma imágenes en mundos virtuales inmersivos.
Taiming Lu, Tianmin Shu, Junfei Xiao
― 8 minilectura
Explorando cómo las máquinas perciben lo visual en comparación con la visión humana.
Jiaying Lin, Shuquan Ye, Rynson W. H. Lau
― 7 minilectura
Gaze-LLE simplifica la estimación de la mirada, mejorando la precisión y la eficiencia en entender la atención humana.
Fiona Ryan, Ajay Bati, Sangmin Lee
― 7 minilectura
Descubre cómo USDRL está cambiando la forma en que reconocemos las acciones humanas.
Wanjiang Weng, Hongsong Wang, Junbo Wang
― 8 minilectura
Aprende cómo se enseña a las computadoras a reconocer acciones humanas con objetos.
Mingda Jia, Liming Zhao, Ge Li
― 9 minilectura
El método MPPO revolucionario mejora las respuestas de la IA gracias a la retroalimentación humana.
Shuo Xie, Fangzhi Zhu, Jiahui Wang
― 7 minilectura
Descubre cómo los investigadores están mejorando la alineación de la IA con los valores humanos a través de métodos innovadores.
Shambhavi Krishna, Aishwarya Sahoo
― 7 minilectura
Descubre cómo la segmentación guiada por prompt está cambiando la tecnología de reconocimiento de imágenes.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 9 minilectura
Una visión general de lo que son en realidad los modelos de lenguaje grandes y sus capacidades.
Murray Shanahan
― 6 minilectura
Una herramienta que mejora la asignación de tareas a través de explicaciones claras e interacción con el usuario.
Guillaume Povéda, Ryma Boumazouza, Andreas Strahl
― 8 minilectura
Descubre cómo RASP mejora la comprensión del lenguaje humano por parte de las máquinas.
Xiao Zhang, Qianru Meng, Johan Bos
― 10 minilectura
Una nueva prueba para que las máquinas respondan preguntas de imágenes y texto.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 8 minilectura
Los modelos de lenguaje tienen problemas con la planificación en el mundo real a pesar de sus habilidades para generar texto.
Cassie Huang, Li Zhang
― 6 minilectura
Los sistemas de IA están mejorando su comprensión de las interfaces gráficas para ofrecer mejores experiencias a los usuarios.
Hai-Ming Xu, Qi Chen, Lei Wang
― 9 minilectura
Manipular el comportamiento de la IA presenta riesgos serios en sistemas avanzados.
Fengshuo Bai, Runze Liu, Yali Du
― 8 minilectura
Un nuevo sistema permite a los robots entender comandos hablados y recoger objetos.
Junliang Li, Kai Ye, Haolan Kang
― 8 minilectura
Descubre cómo los sistemas de TTS están evolucionando para sonar más como humanos.
Haowei Lou, Helen Paik, Wen Hu
― 8 minilectura
CG-Bench ayuda a las máquinas a analizar videos largos mejor con preguntas basadas en pistas.
Guo Chen, Yicheng Liu, Yifei Huang
― 7 minilectura
Combinando diferentes tipos de información para mejorar la comprensión de la inteligencia artificial.
Giordano Cicchetti, Eleonora Grassucci, Luigi Sigillo
― 6 minilectura
Un nuevo punto de referencia para probar el razonamiento de los LLM a través de diferentes contextos culturales.
Mohammad Aflah Khan, Neemesh Yadav, Sarah Masud
― 8 minilectura
Descubre cómo la IA puede alinearse con las intenciones humanas sin resultados no deseados.
Paria Rashidinejad, Yuandong Tian
― 6 minilectura
Un nuevo método mejora la precisión de modelos 3D de manos a partir de imágenes únicas usando modelado generativo enmascarado.
Muhammad Usama Saleem, Ekkasit Pinyoanuntapong, Mayur Jagdishbhai Patel
― 7 minilectura
Descubre cómo la IA tiene problemas para entender fechas y horas.
Gagan Bhatia, MingZe Tang, Cristina Mahanta
― 7 minilectura
Descubre cómo la IA está mejorando la gestión de memoria para tener mejores interacciones.
Elvis Nunez, Luca Zancato, Benjamin Bowman
― 9 minilectura
Un nuevo modelo predice los movimientos de las manos a partir del lenguaje cotidiano.
Chen Bao, Jiarui Xu, Xiaolong Wang
― 6 minilectura
Descubre los últimos avances en el reconocimiento de voz en tiempo real y cómo mejoran nuestras interacciones.
Rongxiang Wang, Zhiming Xu, Felix Xiaozhu Lin
― 6 minilectura
Descubre cómo las máquinas están aprendiendo a combinar imágenes y texto para razonar mejor.
Zihui Cheng, Qiguang Chen, Jin Zhang
― 7 minilectura
Nuevo método transforma la forma en que la tecnología captura los movimientos de las manos con cámaras en movimiento.
Zhengdi Yu, Stefanos Zafeiriou, Tolga Birdal
― 6 minilectura
Descubre cómo la TTS emocional cambia la comunicación con las máquinas, haciéndolas más cercanas.
Sho Inoue, Kun Zhou, Shuai Wang
― 7 minilectura
Investigadores desarrollan el marco SPHERE para mejorar la comprensión de las máquinas sobre las relaciones espaciales.
Wenyu Zhang, Wei En Ng, Lixin Ma
― 8 minilectura
Un nuevo estándar evalúa qué tan bien los modelos de IA satisfacen diversas necesidades humanas.
YiFan Zhang, Shanglin Lei, Runqi Qiao
― 10 minilectura
Un método que alinea los modelos de lenguaje con las preferencias humanas a través de una calibración efectiva.
Teng Xiao, Yige Yuan, Huaisheng Zhu
― 9 minilectura
Explorando cómo los sistemas de IA tienen problemas con el razonamiento espacial en comparación con los humanos.
Jihan Yang, Shusheng Yang, Anjali W. Gupta
― 7 minilectura
Entender el movimiento humano es clave para el trabajo en equipo de los robots.
Kevin Haninger, Luka Peternel
― 6 minilectura
Revolucionando la forma en que la IA entiende imágenes y texto para sistemas más inteligentes.
Yuchong Geng, Ao Tang
― 9 minilectura
Una nueva herramienta mejora las respuestas de la IA para que coincidan mejor con las preferencias humanas.
Zhuoran Jin, Hongbang Yuan, Tianyi Men
― 5 minilectura
El conjunto de datos TH OR-MAGNI Act mejora las predicciones de los robots sobre los movimientos humanos.
Tiago Rodrigues de Almeida, Tim Schreiter, Andrey Rudenko
― 9 minilectura