Mejorando la síntesis de voz para generar voces más naturales y expresivas.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Mejorando la síntesis de voz para generar voces más naturales y expresivas.
― 6 minilectura
Un nuevo conjunto de datos busca mejorar el reconocimiento de voz para hablantes de inglés no nativos.
― 7 minilectura
Un nuevo marco, BiosERC, mejora el reconocimiento de emociones al considerar las características del hablante.
― 7 minilectura
Este estudio examina cómo varían las preferencias de voz entre diferentes oyentes.
― 5 minilectura
Un nuevo modelo aborda sesgos y mejora las predicciones de precios de acciones usando datos diversos.
― 6 minilectura
Este artículo presenta un método para generar sonido preciso a partir de videos y texto.
― 8 minilectura
Un nuevo modelo mejora la simulación de instrumentos de cuerda para un sonido más realista.
― 8 minilectura
Presentamos un método para tener mejor control en la edición de audio.
― 6 minilectura
Un estudio sobre cómo clasificar la música según su época usando características de audio y opiniones de artistas.
― 7 minilectura
Un nuevo modelo mejora el estudio de la comunicación animal usando datos de audio en bruto.
― 7 minilectura
Emilia ofrece un conjunto de datos diverso para mejorar los modelos de generación de voz.
― 7 minilectura
Un nuevo sistema mejora la eficiencia del procesamiento de señales a través de métodos de codificación innovadores.
― 6 minilectura
Un equipo enfrenta los desafíos de identificación de cantos de aves en la competencia BirdCLEF 2024.
― 7 minilectura
Presentamos datasets MERGE para mejorar la clasificación de emociones en la música.
― 7 minilectura
Un nuevo método ayuda a que los modelos más pequeños funcionen mejor usando pistas de modelos más grandes.
― 7 minilectura
Explora las actualizaciones en la versión 3 del conjunto de datos Divide and Remaster.
― 7 minilectura
Una visión general de los conjuntos de datos utilizados en modelos de audio-lenguaje y su importancia.
― 12 minilectura
Un sistema de auriculares confiable monitorea las tasas de respiración durante varias actividades diarias.
― 7 minilectura
Mejorando los sistemas de reconocimiento de voz para idiomas con pocos datos en línea.
― 6 minilectura
Este estudio analiza cómo las redes neuronales interpretan el habla usando espectrogramas.
― 8 minilectura
Combinando sonido e imágenes para sistemas de reconocimiento más inteligentes.
― 8 minilectura
Un método para mejorar la detección de deepfakes de audio mediante la augmentación de datos.
― 6 minilectura
Beat-It genera movimientos de baile sincronizados para mejorar la coreografía sin esfuerzo.
― 7 minilectura
Los investigadores buscan crear sonidos que coincidan con videos en silencio, mejorando la experiencia de los espectadores.
― 6 minilectura
Este estudio aborda los problemas con los sistemas de SLU y su capacidad para generalizar.
― 7 minilectura
Una herramienta auto-supervisada para estimar las tonalidades musicales, reduciendo la necesidad de anotaciones de expertos.
― 6 minilectura
Diff-MST mejora la mezcla de música aplicando transferencia de estilo de pistas de referencia.
― 7 minilectura
ElasticAST permite procesar audio de longitud variable de manera eficiente sin perder detalles importantes.
― 6 minilectura
Analizando métodos de identificación de cantantes en medio de crecientes preocupaciones sobre el clonaje de voces.
― 7 minilectura
Un enfoque nuevo mejora la detección de clips de audio reales y falsos mezclados.
― 7 minilectura
Un nuevo sistema mejora la detección de sonido y la estimación de distancias.
― 5 minilectura
Mamba promete mucho contra transformers en tareas de habla, especialmente con entradas largas.
― 5 minilectura
SingFlex ofrece soluciones innovadoras para crear voces de canto diversas de manera eficiente.
― 6 minilectura
Un estudio sobre la complejidad de las melodías de danza tradicional irlandesa usando métodos de compresión.
― 6 minilectura
RefinPaint mejora la creación musical identificando y puliendo las áreas débiles de manera efectiva.
― 7 minilectura
Descubre cómo los PALs pueden revolucionar el control de zonas de sonido en diferentes ambientes.
― 5 minilectura
El método CUSIDE-array mejora la precisión del reconocimiento de voz en tiempo real en sistemas multicanal.
― 7 minilectura
Un nuevo marco mejora el rendimiento de la verificación de hablantes con datos limitados.
― 8 minilectura
Explorando nuevas formas en que la IA puede colaborar con músicos a través de la interpretación.
― 6 minilectura
Aprende cómo el contexto mejora la precisión del reconocimiento automático de voz y el reconocimiento de palabras.
― 6 minilectura