Nuevo método mejora la precisión en la clasificación de escenas de teledetección usando relaciones contextuales.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevo método mejora la precisión en la clasificación de escenas de teledetección usando relaciones contextuales.
― 7 minilectura
Un nuevo método mejora la clasificación de tejidos cancerosos usando modelos de visión-lenguaje.
― 6 minilectura
Un nuevo método mejora la precisión de segmentación usando los modelos SAM y CLIP.
― 6 minilectura
El estudio investiga cómo los VLMs clasifican estilos artísticos y atributos.
― 7 minilectura
RPP mejora el ajuste y la generalización en Modelos de Visión-Lenguaje usando indicaciones refinadas.
― 9 minilectura
Nuevos métodos mejoran cómo los robots agarran objetos planos.
― 5 minilectura
Nuevos adaptadores mejoran las capacidades de segmentación de imagen de los modelos de visión-lenguaje.
― 9 minilectura
Un nuevo enfoque afina la conexión entre imágenes y texto en los VLMs.
― 6 minilectura
Un nuevo enfoque mejora el análisis de supervivencia en la investigación del cáncer usando datos visuales y de lenguaje.
― 9 minilectura
Un nuevo método mejora la capacidad de agarre de los robots usando comandos en lenguaje natural.
― 7 minilectura
Explorando cómo los modelos de lenguaje mejoran las tecnologías de conducción autónoma.
― 9 minilectura
La investigación muestra cómo los robots pueden navegar mejor usando planos de piso y modelos de lenguaje visual.
― 8 minilectura
Nuevos métodos mejoran la eficiencia y las habilidades de aprendizaje de las aspiradoras inteligentes.
― 6 minilectura
SMART mejora la segmentación de vocabulario abierto al mejorar las técnicas de clasificación de máscaras.
― 7 minilectura
Este estudio presenta BiMI para mejorar los sistemas de recompensa en el aprendizaje por refuerzo.
― 8 minilectura
Nuevo modelo permite a los robots aprender acciones de videos, mejorando el rendimiento en tareas.
― 6 minilectura
Un nuevo marco mejora la conexión entre imágenes y texto.
― 8 minilectura
Un nuevo método mejora el reconocimiento de objetos usando máscaras sin etiquetas detalladas.
― 6 minilectura
Un método para mejorar el rendimiento del modelo a pesar de etiquetas de datos incorrectas.
― 8 minilectura
Una nueva estrategia combina el entrenamiento generativo y discriminativo en Modelos de Visión-Lenguaje.
― 5 minilectura
La investigación examina cómo los VLMs interpretan y entienden gráficos en comparación con las habilidades humanas.
― 6 minilectura
Un nuevo enfoque para mejorar los VLMs y ofrecer mejor asistencia a usuarios con discapacidad visual.
― 7 minilectura
Aprende a mejorar los modelos de imagen-texto y a reducir errores comunes.
― 7 minilectura
Ahora los robots pueden aprender tareas mejor gracias al etiquetado automático de recompensas.
― 9 minilectura
Una visión general de las fortalezas y debilidades de los Modelos de Visión-Lenguaje de hoy.
― 7 minilectura
LLaVA mejora la respuesta a preguntas visuales combinando la potencia local del dispositivo con el procesamiento en la nube.
― 10 minilectura
Una mirada a cómo VLM mejora las tareas de navegación de robots.
― 9 minilectura
Un nuevo método mejora la precisión y transparencia en el diagnóstico de lesiones de la piel para los doctores.
― 7 minilectura
Una visión general sobre el entrenamiento de modelos de lenguaje-visión y su importancia.
― 8 minilectura
Los coches autónomos se están adaptando a tus preferencias para un viaje más seguro.
― 9 minilectura
Un nuevo método mejora la comprensión de los elementos en pantalla por parte de las computadoras.
― 5 minilectura
Las máquinas aprenden a localizar objetos en imágenes usando técnicas innovadoras.
― 5 minilectura
FOCUS simplifica el reconocimiento de objetos con técnicas de comunicación fáciles de usar.
― 7 minilectura
Un nuevo método ayuda a las computadoras a identificar objetos usando menos imágenes y un lenguaje sencillo.
― 8 minilectura
GEOBench-VLM evalúa modelos para interpretar datos e imágenes geoespaciales.
― 6 minilectura
COSMOS mejora la habilidad de la IA para entender imágenes y texto juntos.
― 8 minilectura
Descubre cómo la retroalimentación está cambiando la tecnología de generación de videos para mejor calidad.
― 9 minilectura
Descubre cómo LL-ICM mejora la calidad de imagen mientras reduce el tamaño del archivo.
― 9 minilectura
NaVILA ayuda a los robots a navegar usando lenguaje y visión.
― 7 minilectura
Nuevos modelos combinan texto e imágenes para combatir la desinformación.
― 5 minilectura