El marco Manta mejora el reconocimiento de acciones usando secuencias de video largas y modelado de características locales.
Wenbo Huang, Jinghui Zhang, Guang Li
― 9 minilectura
Ciencia de vanguardia explicada de forma sencilla
El marco Manta mejora el reconocimiento de acciones usando secuencias de video largas y modelado de características locales.
Wenbo Huang, Jinghui Zhang, Guang Li
― 9 minilectura
Video Curious Agent facilita encontrar los momentos clave en videos largos.
Zeyuan Yang, Delin Chen, Xueyang Yu
― 7 minilectura
Aprende cómo nuevos métodos mejoran la precisión temporal en el análisis de videos.
Xizi Wang, Feng Cheng, Ziyang Wang
― 5 minilectura
Las redes neuronales desbloquean información sobre procesos dinámicos a través del análisis de video.
Elisa Negrini, Almanzo Jiahe Gao, Abigail Bowering
― 6 minilectura
Un nuevo marco mejora cómo procesamos videos largos de manera eficiente.
Sosuke Yamao, Natsuki Miyahara, Yuki Harazono
― 8 minilectura
Descubre cómo STDD mejora el reconocimiento de acciones en videos.
Yating Yu, Congqi Cao, Yueran Zhang
― 6 minilectura
Aprende cómo las máquinas interpretan videos, desde clips divertidos hasta aplicaciones críticas.
Katrina Drozdov, Ravid Shwartz-Ziv, Yann LeCun
― 8 minilectura
Nuevas técnicas mejoran cómo las máquinas reconocen e interpretan escenas de video.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 8 minilectura
Nuevo modelo identifica DeepFakes analizando videos completos, no solo rostros.
Rohit Kundu, Hao Xiong, Vishal Mohanty
― 7 minilectura
CG-Bench ayuda a las máquinas a analizar videos largos mejor con preguntas basadas en pistas.
Guo Chen, Yicheng Liu, Yifei Huang
― 7 minilectura
Un nuevo método mejora la segmentación de acciones usando información menos detallada.
Elena Bueno-Benito, Mariella Dimiccoli
― 9 minilectura
Descubre cómo JoVALE mejora la comprensión de acciones en videos.
Taein Son, Soo Won Seo, Jisong Kim
― 8 minilectura
El dataset FriendsQA mejora la comprensión de videos al responder preguntas complejas de episodios de Friends.
Zhengqian Wu, Ruizhe Li, Zijun Xu
― 6 minilectura
HVQ permite una segmentación de acciones precisa en videos largos sin necesidad de datos etiquetados.
Federico Spurio, Emad Bahrami, Gianpiero Francesca
― 7 minilectura
Las máquinas están aprendiendo a predecir acciones futuras en videos, cambiando nuestra forma de interactuar con la tecnología.
Alberto Maté, Mariella Dimiccoli
― 7 minilectura
MVTamperBench evalúa VLMs contra técnicas de manipulación de video para mejorar la fiabilidad.
Amit Agarwal, Srikant Panda, Angeline Charles
― 7 minilectura
N nuevas investigaciones establecen puntos de referencia que mejoran la comprensión de las interacciones cotidianas a través de videos.
Xiaoyang Liu, Boran Wen, Xinpeng Liu
― 7 minilectura
El método LINK mejora la comprensión de los videos al sincronizar el audio y las imágenes de manera efectiva.
Langyu Wang, Bingke Zhu, Yingying Chen
― 5 minilectura