Un nuevo proyecto mejora la comprensión visual de las máquinas a través de un gran conjunto de datos.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo proyecto mejora la comprensión visual de las máquinas a través de un gran conjunto de datos.
― 6 minilectura
Una nueva técnica de enmascaramiento mejora el aprendizaje en video al utilizar el movimiento para un mejor entrenamiento del modelo.
― 7 minilectura
DiffBIR ofrece una solución potente para mejorar imágenes de baja calidad.
― 7 minilectura
Una mirada a las condiciones de Fredholm y operadores pseudodiferenciales en matemáticas y física.
― 7 minilectura
Un nuevo método combina modelos de lenguaje con aprendizaje por refuerzo para el entrenamiento de IA.
― 6 minilectura
Vlogger simplifica el video blogging, haciéndolo más rápido y fácil para los creadores.
― 7 minilectura
A-Eval evalúa modelos para segmentar órganos abdominales en diferentes conjuntos de datos.
― 15 minilectura
Un nuevo método para mejorar las capacidades de razonamiento y explicación de la IA.
― 9 minilectura
RobotScript mejora la forma en que los robots llevan a cabo tareas a partir del lenguaje natural.
― 8 minilectura
Un nuevo marco mejora las acciones de los robots a través de comandos humanos.
― 7 minilectura
El Proyecto V2 Todo Vidente mejora la comprensión de la IA sobre las relaciones entre objetos en las imágenes.
― 8 minilectura
Un conjunto de datos de alta calidad para entrenar modelos de lenguaje a partir de contenido web en inglés.
― 5 minilectura
Los modelos de IA mejoran la comprensión de las escenas de conducción para una navegación más segura.
― 8 minilectura
AVIBench prueba a los LVLMs para asegurarse de que aguanten instrucciones visuales adversariales.
― 9 minilectura
Un nuevo modelo mejora la comprensión de videos a través de técnicas de entrenamiento innovadoras.
― 7 minilectura
Los investigadores crean un conjunto de datos para estudiar cómo la gente aprende imitando a otros.
― 9 minilectura
DIBS mejora la subtitulación de eventos en video refinando los límites usando datos no etiquetados.
― 9 minilectura
Transforma texto en imágenes, videos y audio sin problemas con Lumina-T2X.
― 7 minilectura
Un nuevo enfoque mejora los coches autónomos al imitar los patrones de pensamiento humano.
― 10 minilectura
Este artículo detalla un enfoque innovador para mejorar los modelos de lenguaje utilizando modelos más pequeños.
― 9 minilectura
Un nuevo conjunto de datos y modelo mejoran la calidad de los subtítulos de video para máquinas.
― 6 minilectura
Un conjunto de herramientas para evaluar la seguridad de modelos de lenguaje avanzados.
― 6 minilectura
Nuevo enfoque mejora el aprendizaje a partir de datos intercalados de imagen y texto.
― 8 minilectura
Un conjunto de datos completo que combina imágenes y texto para ayudar al aprendizaje automático.
― 8 minilectura
Un enfoque estructurado para evaluar modelos de texto a video con mayor eficiencia.
― 14 minilectura
Un nuevo marco ayuda a los modelos de lenguaje a aprender lenguaje simbólico sin la ayuda de humanos.
― 8 minilectura
Un nuevo conjunto de datos mejora la capacidad de la IA para procesar documentos científicos de manera efectiva.
― 6 minilectura
Los investigadores mejoran las habilidades de traducción para más de 100 idiomas, centrándose en idiomas con pocos recursos.
― 8 minilectura
Este método simplifica agregar objetos a imágenes con textos, asegurando resultados naturales.
― 6 minilectura
Un nuevo modelo revoluciona la generación de imágenes a partir de descripciones de texto, mejorando varias industrias.
― 6 minilectura
GigaGS aborda los desafíos en la modelación de escenas 3D grandes con técnicas innovadoras.
― 6 minilectura
Un método que mejora la alineación del modelo de lenguaje con las preferencias humanas.
― 6 minilectura
Un nuevo método mejora las habilidades de razonamiento en modelos de lenguaje usando optimización de preferencias.
― 5 minilectura
SyncVIS mejora el seguimiento y la segmentación de objetos en videos para varias aplicaciones.
― 6 minilectura
Nuevo método mejora el rendimiento de tareas visuales en modelos de lenguaje multimodal.
― 8 minilectura
Vinci hace que las tareas diarias sean más fáciles con ayuda manos libres y orientación en tiempo real.
― 8 minilectura