MMPKUBase ofrece más de 52,000 temas chinos con imágenes increíbles.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
MMPKUBase ofrece más de 52,000 temas chinos con imágenes increíbles.
― 6 minilectura
TEAdapter mejora la generación de música a partir de texto, dando a los usuarios más control y creatividad.
― 5 minilectura
Un nuevo conjunto de datos y método mejoran la anclaje de video para narrativas complejas.
― 9 minilectura
Un nuevo método mejora la detección de deepfakes faciales.
― 7 minilectura
Lighthouse hace que sea fácil para los investigadores encontrar momentos en videos y detectar resúmenes.
― 6 minilectura
Nuevo modelo de aprendizaje automático mejora las técnicas de separación de fuentes de audio.
― 6 minilectura
Un sistema para mejorar la claridad del habla en entornos ruidosos usando gafas inteligentes.
― 6 minilectura
COM Kitchens ofrece videos de cocina sin editar para estudiar los procesos de preparación de alimentos.
― 6 minilectura
ReSyncer mejora la calidad de video y la flexibilidad para que los movimientos de los labios estén sincronizados con el audio.
― 6 minilectura
Presentando la sintonización neuronal para mejorar efectivamente las capacidades multitarea de los modelos grandes.
― 7 minilectura
Un nuevo método mejora las búsquedas de productos en diferentes formatos de medios.
― 7 minilectura
Un nuevo enfoque se centra en inconsistencias sutiles en la detección de deepfakes.
― 7 minilectura
Vive el Festival del Barco Dragón con técnicas de remo virtuales innovadoras.
― 9 minilectura
Presentamos un marco que mejora la detección de la depresión a través de entrevistas estructuradas.
― 7 minilectura
Un nuevo método para crear imágenes claras a partir de prompts de texto complejos.
― 6 minilectura
Combinar imágenes y texto mejora las predicciones de eventos futuros.
― 8 minilectura
Este artículo analiza cómo el orden de las canciones impacta la experiencia de escuchar álbumes de música.
― 8 minilectura
Mu-MAE presenta nuevos métodos para reconocer actividades humanas a través de múltiples fuentes de datos.
― 8 minilectura
Un nuevo sistema combate el discurso de odio en memes de manera efectiva.
― 7 minilectura
La técnica ViMo transforma videos cotidianos en movimientos 3D realistas.
― 9 minilectura
Explora los avances y desafíos en la tecnología de VR inalámbrica para múltiples usuarios.
― 8 minilectura
Un nuevo modelo para mejorar imágenes con poca luz de manera más rápida y efectiva.
― 6 minilectura
Un nuevo método para medir la percepción de profundidad en imágenes 3D de realidad virtual.
― 8 minilectura
Un método para resumir videos de diferentes culturas y fuentes de noticias.
― 6 minilectura
Un nuevo método simplifica la edición de escenas 3D usando solo una imagen 2D.
― 7 minilectura
Un nuevo método apunta a sistemas de autenticación facial múltiples de manera eficiente.
― 10 minilectura
Un sistema innovador automatiza la generación de sonido para películas y juegos.
― 9 minilectura
Aprende cómo la Atención de Armonización mejora la mezcla de imágenes al centrarse en la geometría y la textura.
― 7 minilectura
Mejorar la calidad de la imagen lleva a evaluaciones de tamaño de pupila más precisas.
― 7 minilectura
Los benchmarks actuales no evalúan bien la capacidad de los modelos para conectar datos de audio y visuales.
― 6 minilectura
La automatización en la creación de animaciones abre nuevos caminos para contar historias y crear visuales.
― 8 minilectura
Una mirada a las complejidades de identificar pistas de audio mezcladas.
― 7 minilectura
StyleSpeech mejora los sistemas de TTS al captar los matices del habla natural.
― 7 minilectura
Cap2Sum utiliza subtítulos densos en videos para mejorar la eficiencia y efectividad de la resumición de videos.
― 9 minilectura
MaVEn mejora la capacidad de la IA para procesar múltiples imágenes y razonar mejor.
― 7 minilectura
La IA está cambiando cómo se compone y se vive la música.
― 7 minilectura
Un nuevo método mejora el reconocimiento de emociones en conversaciones usando múltiples fuentes de datos.
― 6 minilectura
Presentamos RMARN: una forma innovadora de conectar texto y datos en 3D.
― 6 minilectura
Un nuevo método transforma el texto en escenas 3D detalladas sin problemas.
― 7 minilectura
Un nuevo enfoque para construir espacios virtuales accesibles usando WebXR y A-Frame.
― 7 minilectura