Ming Yan

Un nuevo método mejora la detección de postura para modelos de lenguaje más pequeños usando conocimiento externo.

2025-10-02T00:28:30+00:00 ― 6 minilectura

Un nuevo modelo mejora la recuperación de señales dispersas en entornos ruidosos.

2025-09-27T17:32:57+00:00 ― 8 minilectura

TRIPS mejora la eficiencia en tareas de visión-lenguaje al seleccionar parches de imagen relevantes.

2025-09-17T20:38:36+00:00 ― 8 minilectura

Un nuevo enfoque usando sistemas multiagente para mejorar modelos de lenguaje más pequeños.

2025-09-17T04:26:54+00:00 ― 8 minilectura

Este artículo habla sobre un nuevo marco para evaluar las alucinaciones en los LVLMs.

2025-09-04T12:02:06+00:00 ― 8 minilectura

Un nuevo benchmark evalúa cómo los agentes de juego de roles interactúan socialmente.

2025-08-27T12:43:24+00:00 ― 8 minilectura

Un nuevo marco mejora cómo los agentes de lenguaje aprenden y realizan tareas.

2025-08-27T05:28:54+00:00 ― 8 minilectura

Un nuevo marco mejora la eficiencia y precisión al resolver problemas físicos complejos.

2025-08-01T22:06:12+00:00 ― 8 minilectura

MIBench prueba el rendimiento de modelos multimodales en varias imágenes.

2025-07-09T14:23:18+00:00 ― 7 minilectura

mPLUG-Owl3 mejora la comprensión de imágenes y videos para dar mejores respuestas.

2025-06-30T17:13:12+00:00 ― 8 minilectura

Un nuevo método para combinar modelos de lenguaje de manera más efectiva.

2025-06-29T22:23:30+00:00 ― 7 minilectura

MaVEn mejora la capacidad de la IA para procesar múltiples imágenes y razonar mejor.

2025-06-23T15:38:00+00:00 ― 7 minilectura