Este artículo examina la latencia de varios sistemas de diarización de locutores en el procesamiento de audio.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este artículo examina la latencia de varios sistemas de diarización de locutores en el procesamiento de audio.
― 7 minilectura
Un nuevo conjunto de datos busca mejorar el reconocimiento de voz para hablantes de inglés no nativos.
― 7 minilectura
Un nuevo marco, BiosERC, mejora el reconocimiento de emociones al considerar las características del hablante.
― 7 minilectura
Este estudio examina cómo varían las preferencias de voz entre diferentes oyentes.
― 5 minilectura
Este artículo presenta un método para generar sonido preciso a partir de videos y texto.
― 8 minilectura
Un nuevo modelo mejora la simulación de instrumentos de cuerda para un sonido más realista.
― 8 minilectura
Presentamos un método para tener mejor control en la edición de audio.
― 6 minilectura
Un estudio sobre cómo clasificar la música según su época usando características de audio y opiniones de artistas.
― 7 minilectura
Un nuevo modelo mejora el estudio de la comunicación animal usando datos de audio en bruto.
― 7 minilectura
Un nuevo sistema mejora la eficiencia del procesamiento de señales a través de métodos de codificación innovadores.
― 6 minilectura
Un equipo enfrenta los desafíos de identificación de cantos de aves en la competencia BirdCLEF 2024.
― 7 minilectura
Presentamos datasets MERGE para mejorar la clasificación de emociones en la música.
― 7 minilectura
Este estudio examina el Mix-Training para detectar palabras clave en condiciones de habla ruidosa.
― 6 minilectura
Un nuevo método ayuda a que los modelos más pequeños funcionen mejor usando pistas de modelos más grandes.
― 7 minilectura
Explora las actualizaciones en la versión 3 del conjunto de datos Divide and Remaster.
― 7 minilectura
Una visión general de los conjuntos de datos utilizados en modelos de audio-lenguaje y su importancia.
― 12 minilectura
Un sistema de auriculares confiable monitorea las tasas de respiración durante varias actividades diarias.
― 7 minilectura
Mejorando los sistemas de reconocimiento de voz para idiomas con pocos datos en línea.
― 6 minilectura
Combinando sonido e imágenes para sistemas de reconocimiento más inteligentes.
― 8 minilectura
Un método para mejorar la detección de deepfakes de audio mediante la augmentación de datos.
― 6 minilectura
Beat-It genera movimientos de baile sincronizados para mejorar la coreografía sin esfuerzo.
― 7 minilectura
Los investigadores buscan crear sonidos que coincidan con videos en silencio, mejorando la experiencia de los espectadores.
― 6 minilectura
Este estudio aborda los problemas con los sistemas de SLU y su capacidad para generalizar.
― 7 minilectura
Una herramienta auto-supervisada para estimar las tonalidades musicales, reduciendo la necesidad de anotaciones de expertos.
― 6 minilectura
Diff-MST mejora la mezcla de música aplicando transferencia de estilo de pistas de referencia.
― 7 minilectura
Un nuevo modelo mejora la comunicación para personas con discapacidades usando reconocimiento de voz y código Morse.
― 6 minilectura
ElasticAST permite procesar audio de longitud variable de manera eficiente sin perder detalles importantes.
― 6 minilectura
Analizando métodos de identificación de cantantes en medio de crecientes preocupaciones sobre el clonaje de voces.
― 7 minilectura
Un enfoque nuevo mejora la detección de clips de audio reales y falsos mezclados.
― 7 minilectura
Mamba promete mucho contra transformers en tareas de habla, especialmente con entradas largas.
― 5 minilectura
SingFlex ofrece soluciones innovadoras para crear voces de canto diversas de manera eficiente.
― 6 minilectura
Un estudio sobre la complejidad de las melodías de danza tradicional irlandesa usando métodos de compresión.
― 6 minilectura
RefinPaint mejora la creación musical identificando y puliendo las áreas débiles de manera efectiva.
― 7 minilectura
Un nuevo marco mejora el rendimiento de la verificación de hablantes con datos limitados.
― 8 minilectura
Explorando nuevas formas en que la IA puede colaborar con músicos a través de la interpretación.
― 6 minilectura
CADE mejora la detección de audio contra amenazas de suplantación en evolución usando técnicas de aprendizaje continuo.
― 8 minilectura
Un nuevo método ayuda a los robots a encontrar objetos caídos usando sonido.
― 6 minilectura
Los nuevos sistemas de comandos de voz mejoran el control de drones sin necesidad de usar las manos.
― 6 minilectura
Nuevas técnicas permiten una mejor emulación de amplificadores de guitarra y efectos.
― 7 minilectura
Un nuevo marco mejora el rendimiento de ASR usando datos y recursos limitados.
― 6 minilectura