Este conjunto de datos ayuda a los robots a entender mejor los entornos urbanos.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este conjunto de datos ayuda a los robots a entender mejor los entornos urbanos.
― 8 minilectura
Un nuevo método ofrece múltiples razones para clasificaciones de imágenes, mejorando la comprensión y la confianza.
― 6 minilectura
SINCERE mejora el aprendizaje contrastivo supervisado con mejor separación de clases y representación.
― 8 minilectura
Evaluando modelos grandes en tareas visuales de bajo nivel a través de Q-Bench.
― 6 minilectura
AsymFormer mejora la comprensión del entorno de los robots con un procesamiento RGB-D eficiente.
― 5 minilectura
Estrategias para mejorar la interpretabilidad en sistemas de IA para una mejor comprensión.
― 7 minilectura
Este artículo examina el papel de los modelos de lenguaje en responder preguntas de documentos.
― 8 minilectura
Un nuevo conjunto de datos pensado para mejorar el reconocimiento de objetos durante el corte.
― 8 minilectura
Un nuevo método permite a los modelos reconocer tanto objetos conocidos como desconocidos.
― 8 minilectura
Un nuevo método genera etiquetas detalladas para segmentación semántica usando datos sintéticos.
― 13 minilectura
Nuevos métodos mejoran la evaluación del rendimiento de objetos pequeños en WSSS.
― 8 minilectura
El método BoIR mejora el seguimiento de varias personas en imágenes, aumentando la precisión en escenas concurridas.
― 6 minilectura
Un nuevo método mejora el aprendizaje de objetos 3D sin datos etiquetados.
― 7 minilectura
Un nuevo método mejora la colocación de cámaras para la generación de imágenes 3D de alta calidad.
― 7 minilectura
Nuevos métodos mejoran la eficiencia de la memoria y la precisión en la segmentación de objetos en video.
― 8 minilectura
Un nuevo método mejora la estimación de la pose 3D a partir de imágenes 2D de varias personas.
― 6 minilectura
Un nuevo enfoque simplifica la adaptación para la detección de objetos en diferentes entornos.
― 9 minilectura
M 3D mejora la comprensión de las máquinas sobre los datos visuales usando imágenes e información de profundidad.
― 6 minilectura
Un nuevo método mejora el ajuste fino de los transformadores de visión, reduciendo las necesidades computacionales.
― 6 minilectura
ObVi-SLAM mejora la localización de robots al combinar características visuales y detección de objetos.
― 10 minilectura
Un método para convertir caras en caricaturas mientras se preservan las características únicas.
― 7 minilectura
Un nuevo enfoque traduce descripciones de texto en secuencias de video.
― 6 minilectura
Un nuevo enfoque simplifica el diseño de modelos para dispositivos con poder de cómputo limitado.
― 7 minilectura
Mejorando Zero-Shot NAS usando corrección de sesgo para un mejor rendimiento del modelo.
― 5 minilectura
Mask4D mejora el seguimiento y reconocimiento de objetos en entornos dinámicos usando datos LiDAR.
― 7 minilectura
Presentamos un método de aprendizaje activo que combina incertidumbre y diversidad para mejorar la eficiencia del etiquetado.
― 9 minilectura
Combinar puntos y líneas mejora la precisión al estimar las relaciones en imágenes.
― 5 minilectura
Presentamos Q-REG, un método que optimiza el registro de nubes de puntos 3D a través de un entrenamiento de extremo a extremo.
― 8 minilectura
Nuevos métodos mejoran el rendimiento de VideoQA usando datos de entrenamiento mínimos.
― 6 minilectura
STRPCA mejora la sustracción de fondo para una mejor detección de objetos en videos.
― 7 minilectura
Un nuevo método para crear imágenes rápidamente basadas en las posiciones de la cámara en espacios reales.
― 10 minilectura
Nuevo conjunto de datos y método mejoran la precisión y eficiencia del análisis de fachadas.
― 7 minilectura
Combinar modelos de lenguaje y visión mejora la respuesta a preguntas sobre imágenes sin necesidad de un entrenamiento extenso.
― 7 minilectura
Un estudio muestra que el Aprendizaje Contrastivo Supervisado mejora el rendimiento del modelo en diferentes conjuntos de datos.
― 6 minilectura
Aprende sobre nuevas técnicas que mejoran la orientación de la cámara en la reconstrucción de escenas en 3D.
― 7 minilectura
Un nuevo modelo mejora el reconocimiento de imágenes adaptándose a transformaciones de manera única.
― 7 minilectura
Presentamos MetaCLIP para una mejor recolección de datos de imagen-texto.
― 9 minilectura
Model2Scene usa modelos CAD y lenguaje para mejorar el aprendizaje de escenas 3D.
― 5 minilectura
Un nuevo método mejora el seguimiento y el procesamiento en el análisis de video.
― 7 minilectura
Nuevo método reduce los tokens de visión para un entrenamiento más económico.
― 6 minilectura