Nuevo conjunto de datos mejora la generación de audio a partir de descripciones de texto detalladas.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevo conjunto de datos mejora la generación de audio a partir de descripciones de texto detalladas.
― 6 minilectura
Presentamos datasets MERGE para mejorar la clasificación de emociones en la música.
― 7 minilectura
Una mirada a los métodos de creación y detección de deepfakes.
― 8 minilectura
Examinando cómo la retroalimentación durante colisiones moldea la experiencia del usuario en espacios VR llenos de gente.
― 7 minilectura
Un nuevo enfoque mejora la detección de deepfakes usando análisis audiovisual.
― 7 minilectura
Un nuevo método mejora la creación de sonido para modelos humanos 3D realistas.
― 8 minilectura
Un nuevo método combina texto, emociones y audio para mejorar la detección de la salud mental.
― 8 minilectura
Un proyecto que ofrece apoyo emocional a través de respuestas de audio para quienes lo necesiten.
― 6 minilectura
Un nuevo modelo de texto a audio usando solo datos públicos.
― 6 minilectura
OmniBind integra varios tipos de datos para mejorar la comprensión y generación de contenido.
― 6 minilectura
Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.
― 7 minilectura
Un estudio sobre cómo mejorar los métodos para detectar la compresión de audio con pérdidas para una mejor calidad de sonido.
― 7 minilectura
Un nuevo modelo que sincroniza las anotaciones de acordes con el audio de la música de manera fluida.
― 7 minilectura
Un marco que identifica de manera efectiva contenido deepfake a través de un análisis combinado de audio y visual.
― 6 minilectura
Un nuevo enfoque combina audio, video y datos de texto para un diagnóstico efectivo de la depresión.
― 9 minilectura
VAT-CMR permite que los robots recuperen objetos usando datos visuales, de audio y táctiles.
― 8 minilectura
UniTalker une datasets para mejorar la precisión de la animación facial.
― 8 minilectura
Style-Talker mejora las conversaciones entre humanos y máquinas a través de la profundidad emocional.
― 10 minilectura
Un nuevo enfoque se centra en inconsistencias sutiles en la detección de deepfakes.
― 7 minilectura
Un nuevo método combina EEG, audio y expresiones faciales para evaluar la salud mental.
― 7 minilectura
Una mirada a las complejidades de identificar pistas de audio mezcladas.
― 7 minilectura
Un nuevo modelo separa el timbre y la estructura para crear mejor audio.
― 8 minilectura
RoboMNIST ayuda a los robots a reconocer varias actividades usando WiFi, video y audio.
― 7 minilectura
X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.
― 7 minilectura
Nuevos métodos mejoran la separación de voces en entornos ruidosos.
― 5 minilectura
Un nuevo sistema genera voz a partir de texto usando datos mínimos.
― 5 minilectura
Nuevos métodos de marca de agua protegen a los creadores en modelos generativos de audio.
― 5 minilectura
Un nuevo marco mejora la generación de movimiento para animaciones y experiencias virtuales.
― 7 minilectura
Un nuevo modelo simplifica la producción de audio al eliminar automáticamente los sonidos de respiración.
― 7 minilectura
Un nuevo método mejora la transformación de audio mientras preserva la melodía y la calidad del sonido.
― 7 minilectura
Este estudio evalúa redes neuronales para replicar las características de la reverberación de muelles.
― 9 minilectura
ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.
― 6 minilectura
Nuevos métodos mejoran el acceso a noticias habladas al segmentar mejor los temas.
― 8 minilectura
SoloAudio mejora la extracción de sonido usando técnicas avanzadas y datos sintéticos.
― 6 minilectura
Nuevo modelo mejora la detección de hablantes en tiempo real y la eficiencia en la comunicación.
― 6 minilectura
Un nuevo modelo mejora la generación de audio usando texto detallado y sonidos como prompts.
― 7 minilectura
MusicLIME ayuda a explicar el enfoque de la IA para analizar música a través de audio y letras.
― 7 minilectura
Un nuevo modelo crea audio que coincide con el video, mejorando las experiencias mediáticas.
― 5 minilectura
Un nuevo enfoque integra videos de clases y diapositivas para mejorar la participación de los estudiantes.
― 7 minilectura
Este estudio analiza cómo el audio, el video y el texto funcionan juntos en el reconocimiento de voz.
― 8 minilectura