Evaluando modelos grandes en tareas visuales de bajo nivel a través de Q-Bench.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Evaluando modelos grandes en tareas visuales de bajo nivel a través de Q-Bench.
― 6 minilectura
Últimos artículos
Últimos artículos
Un nuevo marco identifica y mide el sesgo en los sistemas de generación de imágenes.
― 10 minilectura
Explora cómo los Modelos de Difusión mejoran la super-resolución en varios campos.
― 7 minilectura
Un nuevo modelo mejora videos de baja calidad mientras reduce la demanda de procesamiento.
― 9 minilectura
SAMA mejora la evaluación de la calidad de imágenes y videos a través de técnicas de muestreo efectivas.
― 6 minilectura
Este estudio examina las dificultades de usar el aprendizaje contrastivo para entender videos musicales.
― 6 minilectura
Un nuevo método simplifica el diseño de los ojos de personajes animados.
― 8 minilectura
Un nuevo método mejora la compresión de imágenes al centrarse en bandas de frecuencia.
― 7 minilectura
Vlogger simplifica el video blogging, haciéndolo más rápido y fácil para los creadores.
― 7 minilectura
Examinando el uso de energía y el impacto del streaming de video en el medio ambiente.
― 8 minilectura
Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.
― 6 minilectura
Descubre cómo la IA está cambiando la creación y transmisión de videos.
― 7 minilectura
Un conjunto de datos diseñado para probar la calidad de video en situaciones de videoconferencia.
― 6 minilectura
Los investigadores desarrollan un marco para mejorar la comprensión de videos y textos.
― 6 minilectura
Un nuevo método mejora la segmentación audio-visual sin etiquetas detalladas.
― 6 minilectura
PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.
― 7 minilectura
Un nuevo sistema que conecta la música y el lenguaje para una mejor comprensión.
― 7 minilectura
Aprende a diseñar carteles que comuniquen mensajes de manera clara y atractiva.
― 6 minilectura
Un nuevo conjunto de datos mejora la capacidad de la IA para interpretar el comportamiento humano en videos.
― 8 minilectura
Spica mejora el acceso a videos para usuarios ciegos y con baja visión a través de la interactividad.
― 5 minilectura
Explorando métodos para mejorar el rendimiento de los robots en entornos impredecibles.
― 5 minilectura
Nuevo método transforma voces usando rasgos faciales para diversas aplicaciones.
― 10 minilectura
AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.
― 6 minilectura
Un nuevo método simplifica la búsqueda de videos al combinar diferentes tipos de información.
― 7 minilectura
Desarrollando máquinas que responden según las emociones para mejorar la interacción entre humanos y computadoras.
― 7 minilectura
Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.
― 5 minilectura
Mejorando la forma en que identificamos fuentes de sonido usando datos audio-visuales.
― 8 minilectura
Un método para visualizar y predecir sonidos en diferentes entornos usando tecnología avanzada.
― 6 minilectura
Un nuevo enfoque para mejorar la calidad de la transmisión de video en vivo por móvil y la eficiencia energética.
― 11 minilectura
ChatDiet combina datos personales y conocimientos de la población para dar mejores consejos sobre comida.
― 9 minilectura
Un análisis de sesgo e incivilidad en los debates de la televisión india.
― 7 minilectura
Nuevo marco mejora la eficiencia y calidad de la compresión de video.
― 7 minilectura
Este artículo examina cómo las imágenes impactaron la opinión pública durante el conflicto entre Rusia y Ucrania.
― 5 minilectura
Un nuevo método mejora la calidad de la imagen durante la transmisión inalámbrica en canales ruidosos.
― 6 minilectura
MemeCraft crea memes chidos para promover causas sociales de manera segura.
― 12 minilectura
Un nuevo método mejora el aprendizaje automático de datos audio-visuales.
― 7 minilectura
La investigación revela formas más amplias de dar direcciones usando conocimiento espacial.
― 9 minilectura
Combinando audio, video y texto para mejorar las evaluaciones de salud mental.
― 6 minilectura
Nuevo marco mejora la sincronización de labios y la calidad visual en videos de caras hablando.
― 6 minilectura
Un nuevo método genera muestras defectuosas falsas para mejorar la detección de anomalías en la fabricación.
― 7 minilectura
Un nuevo método mejora la verificación de hablantes al combinar datos de audio y visuales.
― 6 minilectura