Yu Qiao

Visión por Computador y Reconocimiento de Patrones Avanzando en la Visión por Computadora con el Proyecto Todo-Vidente

Un nuevo proyecto mejora la comprensión visual de las máquinas a través de un gran conjunto de datos.

2025-10-12T18:16:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Enmascaramiento Guiado por Movimiento: Avanzando en el Aprendizaje de Video

Una nueva técnica de enmascaramiento mejora el aprendizaje en video al utilizar el movimiento para un mejor entrenamiento del modelo.

2025-10-06T05:35:42+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en la Restauración de Imágenes Ciegas con DiffBIR

DiffBIR ofrece una solución potente para mejorar imágenes de baja calidad.

2025-10-03T06:45:30+00:00 ― 7 minilectura

Análisis de EDP Entendiendo los Operadores de Fredholm y Sus Aplicaciones

Una mirada a las condiciones de Fredholm y operadores pseudodiferenciales en matemáticas y física.

2025-09-29T18:38:57+00:00 ― 7 minilectura

Inteligencia artificial Marco para Entrenar Agentes de IA Adaptativa

Un nuevo método combina modelos de lenguaje con aprendizaje por refuerzo para el entrenamiento de IA.

2025-09-19T19:46:48+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Vlogger: Una nueva herramienta para la creación de videos

Vlogger simplifica el video blogging, haciéndolo más rápido y fácil para los creadores.

2025-09-16T11:12:00+00:00 ― 7 minilectura

Procesado de imagen y vídeo A-Eval: Evaluación de Modelos de Segmentación de Órganos Abdominales

A-Eval evalúa modelos para segmentar órganos abdominales en diferentes conjuntos de datos.

2025-09-15T17:17:50+00:00 ― 15 minilectura

Computación y lenguaje Avanzando la IA con técnicas de razonamiento estructurado

Un nuevo método para mejorar las capacidades de razonamiento y explicación de la IA.

2025-09-14T14:33:54+00:00 ― 9 minilectura

Robótica Avanzando en la Generación de Código para Robots con RobotScript

RobotScript mejora la forma en que los robots llevan a cabo tareas a partir del lenguaje natural.

2025-09-05T03:58:00+00:00 ― 8 minilectura

Robótica Avances en la Síntesis del Comportamiento de Robots

Un nuevo marco mejora las acciones de los robots a través de comandos humanos.

2025-09-04T09:55:42+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en el Reconocimiento de Relaciones entre Objetos

El Proyecto V2 Todo Vidente mejora la comprensión de la IA sobre las relaciones entre objetos en las imágenes.

2025-09-02T23:57:30+00:00 ― 8 minilectura

Computación y lenguaje WanJuan-CC: Un nuevo conjunto de datos para modelos de lenguaje

Un conjunto de datos de alta calidad para entrenar modelos de lenguaje a partir de contenido web en inglés.

2025-09-02T21:19:30+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en IA para la conducción autónoma

Los modelos de IA mejoran la comprensión de las escenas de conducción para una navegación más segura.

2025-08-31T12:26:42+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones AVIBench: Nueva herramienta para evaluar LVLMs contra ataques adversariales

AVIBench prueba a los LVLMs para asegurarse de que aguanten instrucciones visuales adversariales.

2025-08-29T08:26:12+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en Modelos de Comprensión de Video

Un nuevo modelo mejora la comprensión de videos a través de técnicas de entrenamiento innovadoras.

2025-08-26T20:39:36+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo conjunto de datos capta el aprendizaje a través de la observación

Los investigadores crean un conjunto de datos para estudiar cómo la gente aprende imitando a otros.

2025-08-26T05:31:06+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la subtitulación densa de videos con el marco DIBS

DIBS mejora la subtitulación de eventos en video refinando los límites usando datos no etiquetados.

2025-08-22T21:35:48+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Lumina-T2X: Una Nueva Era en la Creación de Medios

Transforma texto en imágenes, videos y audio sin problemas con Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 7 minilectura

Robótica Avanzando en coches autónomos con toma de decisiones como la de los humanos

Un nuevo enfoque mejora los coches autónomos al imitar los patrones de pensamiento humano.

2025-08-07T12:24:12+00:00 ― 10 minilectura

Computación y lenguaje Búsqueda de Débil a Fuerte: Una Nueva Manera de Guiar Modelos de Lenguaje Grande

Este artículo detalla un enfoque innovador para mejorar los modelos de lenguaje utilizando modelos más pequeños.

2025-08-05T05:45:42+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando los subtítulos de video para un mejor aprendizaje automático

Un nuevo conjunto de datos y modelo mejoran la calidad de los subtítulos de video para máquinas.

2025-08-01T13:56:24+00:00 ― 6 minilectura

Computación y lenguaje Evaluando la seguridad en modelos de lenguaje multimodal

Un conjunto de herramientas para evaluar la seguridad de modelos de lenguaje avanzados.

2025-07-30T14:40:18+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en los métodos de entrenamiento de modelos de visión

Nuevo enfoque mejora el aprendizaje a partir de datos intercalados de imagen y texto.

2025-07-30T14:16:36+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Conjunto de datos OmniCorpus: Un nuevo recurso para el aprendizaje multimodal

Un conjunto de datos completo que combina imágenes y texto para ayudar al aprendizaje automático.

2025-07-29T22:44:24+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo protocolo establece estándar para la evaluación de texto a video

Un enfoque estructurado para evaluar modelos de texto a video con mayor eficiencia.

2025-07-29T03:38:54+00:00 ― 14 minilectura

Computación y lenguaje Avanzando Modelos de Lenguaje a Través de Métodos de Autoentrenamiento

Un nuevo marco ayuda a los modelos de lenguaje a aprender lenguaje simbólico sin la ayuda de humanos.

2025-07-27T19:31:18+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Presentamos DocGenome: Un Conjunto de Datos para la Comprensión de Documentos Científicos

Un nuevo conjunto de datos mejora la capacidad de la IA para procesar documentos científicos de manera efectiva.

2025-07-27T17:40:42+00:00 ― 6 minilectura

Computación y lenguaje Avances en las capacidades de traducción de modelos de lenguaje

Los investigadores mejoran las habilidades de traducción para más de 100 idiomas, centrándose en idiomas con pocos recursos.

2025-07-17T07:07:00+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Una nueva forma de agregar objetos a las imágenes usando texto

Este método simplifica agregar objetos a imágenes con textos, asegurando resultados naturales.

2025-07-08T14:33:24+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de texto a imagen

Un nuevo modelo revoluciona la generación de imágenes a partir de descripciones de texto, mejorando varias industrias.

2025-07-02T04:22:30+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la reconstrucción de escenas 3D con GigaGS

GigaGS aborda los desafíos en la modelación de escenas 3D grandes con técnicas innovadoras.

2025-06-14T10:18:06+00:00 ― 6 minilectura

Computación y lenguaje Mejorando Modelos de Lenguaje con Guía de Valor Integrada

Un método que mejora la alineación del modelo de lenguaje con las preferencias humanas.

2025-06-04T22:46:54+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el razonamiento en modelos multimodales

Un nuevo método mejora las habilidades de razonamiento en modelos de lenguaje usando optimización de preferencias.

2025-05-22T16:25:03+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones SyncVIS: Transformando la segmentación de instancias en video

SyncVIS mejora el seguimiento y la segmentación de objetos en videos para varias aplicaciones.

2025-04-27T23:24:15+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Optimizando la comprensión visual en modelos de IA

Nuevo método mejora el rendimiento de tareas visuales en modelos de lenguaje multimodal.

2025-01-24T20:33:00+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Conoce a Vinci: Tu Asistente Inteligente para la Vida

Vinci hace que las tareas diarias sean más fáciles con ayuda manos libres y orientación en tiempo real.

2025-01-18T22:30:27+00:00 ― 8 minilectura