Nuevo método mejora la localización de fuentes de sonido y la separación de campos.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevo método mejora la localización de fuentes de sonido y la separación de campos.
― 7 minilectura
Un nuevo método mejora la síntesis del sonido de los tambores al centrarse en los elementos transitorios agudos.
― 7 minilectura
Los investigadores están desarrollando datos de voz sintética para proteger la privacidad en el reconocimiento de voz.
― 7 minilectura
VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.
― 5 minilectura
Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.
― 5 minilectura
EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.
― 6 minilectura
Un estudio sobre el uso de aprendizaje automático para identificar los sonidos de los niños para la evaluación del TDAH.
― 6 minilectura
Presentamos un método flexible para reconocer palabras clave en el habla en diferentes idiomas.
― 7 minilectura
Una mirada a cómo se prueba la calidad del habla usando crowdsourcing.
― 6 minilectura
Un nuevo método entrena sistemas de captioning de audio usando solo descripciones de texto.
― 7 minilectura
Una guía para redactar trabajos académicos claros y efectivos.
― 4 minilectura
Examinando los riesgos de ataques de puerta trasera en sistemas de verificación de voz.
― 8 minilectura
Un nuevo método mejora la segmentación audio-visual sin etiquetas detalladas.
― 6 minilectura
PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.
― 7 minilectura
Libriheavy ofrece 50,000 horas de inglés hablado para mejorar la tecnología de reconocimiento de voz.
― 6 minilectura
AV2Wav mejora la calidad del habla usando pistas de audio y visuales.
― 6 minilectura
Un método nuevo para que las máquinas alteren las emociones del habla de manera natural.
― 6 minilectura
Se están desarrollando nuevos métodos para identificar voces cantantes deepfake en la industria musical.
― 7 minilectura
La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.
― 6 minilectura
Nuevos modelos están cambiando la forma en que analizamos las emociones en el habla.
― 7 minilectura
Un nuevo método usa ultrasonido para reconocer acciones mientras protege la privacidad.
― 6 minilectura
Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.
― 8 minilectura
CiwaGAN combina el control de los movimientos del habla y el intercambio de información para un mejor aprendizaje del habla.
― 8 minilectura
Un marco que mezcla señales verbales y no verbales para mejorar el aprendizaje de idiomas.
― 7 minilectura
Un nuevo método simplifica la comprensión de los modelos de clasificación de voz.
― 7 minilectura
Un nuevo sistema mejora las habilidades de pronunciación al tener en cuenta las influencias del idioma materno.
― 6 minilectura
Descubre cómo las herramientas cuánticas cambian la creación y la interpretación de la música.
― 8 minilectura
Nuevo método mejora la preservación de emociones en los procesos de conversión de voz.
― 6 minilectura
Nuevo método preserva el tono emocional en la conversión de voz para mejorar la interacción humano-computadora.
― 7 minilectura
Nuevos sistemas mejoran la traducción de texto a lenguaje hablado sin intermediarios.
― 5 minilectura
Los investigadores mejoran la precisión en la clasificación de sonidos del corazón usando métodos de aumento de datos con códec.
― 7 minilectura
La investigación revela que el habla emocional afecta el rendimiento del modelo en tareas de separación de voz.
― 8 minilectura
M-AUDIODEC comprime audio multicanal manteniendo la posición de los altavoces y la calidad.
― 7 minilectura
Nuevos métodos en S2ST mejoran la calidad de la traducción manteniendo la identidad del hablante.
― 6 minilectura
Un nuevo sistema mejora la compresión de audio espacial para un sonido más claro y eficiente.
― 5 minilectura
Un nuevo sistema que conecta la música y el lenguaje para una mejor comprensión.
― 7 minilectura
La investigación revela nuevos modelos para mejorar la claridad del sonido en los auriculares inteligentes.
― 6 minilectura
Usar información extra mejora nuestra capacidad para identificar los cantos de los pájaros.
― 7 minilectura
Un nuevo enfoque mejora la generación de audio alineando el audio con descripciones de texto.
― 6 minilectura
Los investigadores trabajan para mejorar el reconocimiento de voz en línea usando modelos de espacio de estados estructurados.
― 6 minilectura