Un nuevo sistema combina transcripción y traducción para mejorar la comunicación.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo sistema combina transcripción y traducción para mejorar la comunicación.
― 5 minilectura
Whisper-AT combina el reconocimiento de voz y el etiquetado de audio para un mejor rendimiento.
― 7 minilectura
Un nuevo enfoque que combina el habla con modelos de lenguaje para mejorar la traducción.
― 5 minilectura
Nuevo método mejora la precisión al convertir audio de piano en partituras.
― 5 minilectura
Este artículo habla de las necesidades y desafíos en la tecnología de audio generativo.
― 6 minilectura
Nuevos métodos usan los sonidos de la tos y datos de salud para detectar mejor la tuberculosis.
― 7 minilectura
Este estudio examina cómo evolucionan las características de la voz en pacientes con cáncer oral después del tratamiento.
― 7 minilectura
Un nuevo método para cambiar el timbre musical usando técnicas avanzadas de aprendizaje automático.
― 5 minilectura
Nuevos métodos mejoran la precisión del reconocimiento de voz, solucionando errores comunes de transcripción.
― 5 minilectura
Un estudio sobre cómo mejorar la reproducción del sonido vocal con técnicas de síntesis avanzadas.
― 7 minilectura
VampNet transforma el procesamiento de música a través de técnicas innovadoras de modelado de tokens.
― 5 minilectura
Tecnología portátil asequible para personas con pérdida auditiva.
― 6 minilectura
Un nuevo modelo mejora la precisión de tiempo para las letras en aplicaciones de música.
― 7 minilectura
Un sintetizador en línea que permite a los usuarios crear música usando gestos simples.
― 5 minilectura
Un estudio sobre el papel de la IA en la generación de música metal progresivo.
― 7 minilectura
Un modelo que crea tablaturas de guitarra reflejando los estilos de guitarristas famosos.
― 7 minilectura
Explorando el potencial del aprendizaje auto-supervisado en la recuperación de información musical.
― 7 minilectura
Usando señales de audio para identificar riesgos de salud respiratoria.
― 9 minilectura
Un nuevo método mejora la velocidad y precisión del reconocimiento de voz mientras reduce el uso de recursos.
― 7 minilectura
Este estudio mejora el monitoreo de la fauna usando embeddings de características de audio para una mejor clasificación de sonidos.
― 10 minilectura
Urhythmic mejora la conversión de voz al centrarse en el ritmo del habla.
― 6 minilectura
La investigación mejora las técnicas de fingerstyle percutivo para guitarristas usando recuperación de sonido en tiempo real.
― 9 minilectura
Este artículo explora un nuevo modelo para la identificación de intención de habla y slots.
― 7 minilectura
A medida que la tecnología de clonación de voz avanza, los métodos de detección confiables son cruciales.
― 8 minilectura
Nuevo método mejora el reconocimiento de voz usando solo datos de audio en bruto.
― 6 minilectura
Un estudio mejora el reconocimiento de voz para personas mayores, usando técnicas innovadoras.
― 7 minilectura
BASS mejora la resumición de audios largos procesando en bloques.
― 6 minilectura
Nuevos métodos plantean serios riesgos de seguridad para la tecnología de reconocimiento de voz.
― 8 minilectura
ivrit.ai ofrece recursos clave para mejorar la tecnología de ASR en hebreo.
― 8 minilectura
Técnicas innovadoras están cambiando la forma en que traducimos el lenguaje hablado.
― 7 minilectura
Nuevos métodos buscan ocultar las identidades de los hablantes mientras mantienen la claridad del habla.
― 6 minilectura
Nuevo modelo mejora la velocidad de reconocimiento de voz y el uso de memoria.
― 7 minilectura
Nuevos métodos mejoran el reconocimiento de voz en campos específicos sin necesidad de mucha data.
― 7 minilectura
Un nuevo conjunto de datos resalta las interpretaciones creativas de los pianistas de jazz sobre los clásicos.
― 5 minilectura
Nuevos métodos mejoran la representación del sonido en la realidad virtual y aumentada.
― 8 minilectura
FlexiAST permite que los modelos se adapten de manera eficiente a diferentes tamaños de parches de audio.
― 7 minilectura
Los investigadores están usando aprendizaje automático para mejorar el diagnóstico de cáncer de garganta a través del análisis del habla.
― 8 minilectura
Un nuevo modelo mejora la forma en que las computadoras procesan el lenguaje hablado.
― 5 minilectura
Polyffusion usa técnicas visuales para generar y controlar música de manera efectiva.
― 7 minilectura
Los investigadores están usando patrones de habla para detectar el Alzheimer más temprano y de manera más efectiva.
― 7 minilectura