Las transcripciones de ASR con errores pueden ayudar a identificar el Alzheimer de manera más precisa.
― 10 minilectura
Ciencia de vanguardia explicada de forma sencilla
Las transcripciones de ASR con errores pueden ayudar a identificar el Alzheimer de manera más precisa.
― 10 minilectura
Últimos artículos
― 6 minilectura
― 8 minilectura
― 8 minilectura
― 7 minilectura
Analizar los sonidos de las gallinas ayuda a mejorar su salud y la productividad de la granja.
― 9 minilectura
Un método para ayudar a las personas con discapacidad visual a reconocer sonidos en realidad mixta.
― 6 minilectura
Este artículo habla sobre soluciones para aplicaciones de voz en idiomas con datos transcritos limitados.
― 7 minilectura
Los investigadores combinan métodos generativos y discriminativos para mejorar la clasificación de sonidos.
― 7 minilectura
Un nuevo modelo mejora la seguridad de la identificación de voz y resiste el engaño por voz.
― 7 minilectura
Una mirada a la Atención Adaptativa Gaussiana para mejorar el rendimiento de la IA.
― 7 minilectura
La investigación muestra que el aprendizaje profundo mejora nuestra comprensión del ritmo del lenguaje.
― 7 minilectura
CoAVT integra datos de audio, visuales y de texto para una mejor comprensión.
― 9 minilectura
E-SHARC mejora la identificación de hablantes en varios entornos de audio.
― 7 minilectura
Un nuevo sistema genera música diseñada para expresar felicidad y tristeza.
― 7 minilectura
Una guía para entender la similitud musical en modelos generativos.
― 11 minilectura
Un estudio sobre síntesis de sonido y su evaluación en entornos controlados.
― 6 minilectura
Un nuevo método mejora la precisión para localizar fuentes de sonido en movimiento usando arreglos de micrófonos.
― 8 minilectura
PAM ofrece una forma novedosa de medir la calidad del audio sin necesidad de grabaciones de referencia.
― 8 minilectura
Audio Flamingo destaca en escuchar, conversar y adaptarse a nuevas tareas de audio.
― 7 minilectura
Un nuevo modelo mejora la comprensión del audio espacial por parte de las máquinas.
― 6 minilectura
Un nuevo modelo mejora la eficiencia de conversión de voz a texto en aplicaciones en tiempo real.
― 7 minilectura
Este estudio evalúa sonidos frente a palabras en la reconstrucción de árboles genealógicos de lenguas.
― 7 minilectura
Nuevo modelo mejora la creación de música usando la retroalimentación de los usuarios.
― 9 minilectura
Reborn ofrece soluciones innovadoras para el reconocimiento automático de voz sin datos etiquetados.
― 7 minilectura
Una nueva herramienta ayuda a los usuarios a modificar sonidos fácilmente a través de simples instrucciones de texto.
― 10 minilectura
Un nuevo modelo combina el lenguaje hablado y el escrito para mejorar la comunicación.
― 6 minilectura
Una mirada a nuevos modelos para respuestas habladas naturales.
― 8 minilectura
Un nuevo método integra información acústica en los modelos de lenguaje para mejorar el reconocimiento de voz.
― 10 minilectura
Usar música para explicar el cáncer puede mejorar la comprensión y el interés.
― 8 minilectura
Aprende cómo la localización del sonido identifica la fuente de los sonidos utilizando técnicas avanzadas.
― 5 minilectura
Un nuevo enfoque para sintetizar voces con una mejor precisión rítmica.
― 10 minilectura
Los LLMs mejoran la precisión en las transcripciones médicas, beneficiando la atención al paciente.
― 8 minilectura
Un método para mejorar la extracción de melodías en diferentes estilos musicales con mínimo esfuerzo humano.
― 9 minilectura
Nuevos métodos mejoran la detección de actividad de voz y superposición en la diarización del hablante.
― 8 minilectura
Nuevo método integra señales de voz para mejorar la detección de la depresión.
― 5 minilectura
Este artículo habla sobre métodos para crear campos de sonido inmersivos usando diferentes arreglos.
― 6 minilectura
Un nuevo método reduce el sonido metálico no deseado en la reverberación de audio.
― 6 minilectura
Chirp MFCC mejora la representación de la señal de audio para una mejor clasificación y reconocimiento.
― 6 minilectura
El proyecto EMO-SUPERB mejora el reconocimiento de emociones en el habla a través de técnicas mejoradas y la colaboración de la comunidad.
― 8 minilectura
Un nuevo sistema para evaluar el rendimiento de los códecs de audio en diferentes aplicaciones.
― 8 minilectura
Este estudio revisa cómo el tamaño del lote influye en el rendimiento y entrenamiento del modelo de voz.
― 9 minilectura
Descubre cómo la IA está transformando la creación musical a través de la colaboración con humanos.
― 9 minilectura
Mejorando los sistemas de ASV para reconocer las voces de los niños con precisión.
― 11 minilectura
Nueva tecnología mejora la precisión del diagnóstico de enfermedades pulmonares a través del análisis de sonido.
― 7 minilectura