Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.
― 6 minilectura
Un nuevo método mejora la creación de videos con cabezas hablantes que expresan emociones.
― 8 minilectura
Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.
― 6 minilectura
El modelo CLAP conecta el procesamiento de audio y texto para varias aplicaciones.
― 5 minilectura
Un proyecto tiene como objetivo mejorar el procesamiento del habla en francés usando aprendizaje auto-supervisado.
― 6 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen el ritmo y la emoción del habla.
― 8 minilectura
Un nuevo enfoque mejora la estimación del sonido en espacios con objetos que disipan.
― 7 minilectura
Examina cómo la indecibilidad influye en la composición y producción musical hoy en día.
― 5 minilectura
Este artículo explora los avances en la diarización de hablantes usando modelos de lenguaje para mejorar la precisión.
― 6 minilectura
Este estudio mejora la capacidad de los sistemas de reconocimiento de voz para entender el habla de los niños.
― 7 minilectura
Los investigadores están explorando tecnología de detección de audio para mejorar la identificación de peatones en áreas urbanas.
― 6 minilectura
Nuevo método mejora la localización de fuentes de sonido y la separación de campos.
― 7 minilectura
Un nuevo método mejora la síntesis del sonido de los tambores al centrarse en los elementos transitorios agudos.
― 7 minilectura
Los investigadores están desarrollando datos de voz sintética para proteger la privacidad en el reconocimiento de voz.
― 7 minilectura
VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.
― 5 minilectura
Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.
― 5 minilectura
EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.
― 6 minilectura
Un estudio sobre el uso de aprendizaje automático para identificar los sonidos de los niños para la evaluación del TDAH.
― 6 minilectura
Presentamos un método flexible para reconocer palabras clave en el habla en diferentes idiomas.
― 7 minilectura
Una mirada a cómo se prueba la calidad del habla usando crowdsourcing.
― 6 minilectura
Un nuevo método entrena sistemas de captioning de audio usando solo descripciones de texto.
― 7 minilectura
Una guía para redactar trabajos académicos claros y efectivos.
― 4 minilectura
Examinando los riesgos de ataques de puerta trasera en sistemas de verificación de voz.
― 8 minilectura
Un nuevo método mejora la segmentación audio-visual sin etiquetas detalladas.
― 6 minilectura
PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.
― 7 minilectura
Libriheavy ofrece 50,000 horas de inglés hablado para mejorar la tecnología de reconocimiento de voz.
― 6 minilectura
AV2Wav mejora la calidad del habla usando pistas de audio y visuales.
― 6 minilectura
Un método nuevo para que las máquinas alteren las emociones del habla de manera natural.
― 6 minilectura
Se están desarrollando nuevos métodos para identificar voces cantantes deepfake en la industria musical.
― 7 minilectura
La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.
― 6 minilectura
Nuevos modelos están cambiando la forma en que analizamos las emociones en el habla.
― 7 minilectura
Un nuevo método usa ultrasonido para reconocer acciones mientras protege la privacidad.
― 6 minilectura
Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.
― 8 minilectura
CiwaGAN combina el control de los movimientos del habla y el intercambio de información para un mejor aprendizaje del habla.
― 8 minilectura
Un marco que mezcla señales verbales y no verbales para mejorar el aprendizaje de idiomas.
― 7 minilectura
Un nuevo método simplifica la comprensión de los modelos de clasificación de voz.
― 7 minilectura
Un nuevo sistema mejora las habilidades de pronunciación al tener en cuenta las influencias del idioma materno.
― 6 minilectura
Descubre cómo las herramientas cuánticas cambian la creación y la interpretación de la música.
― 8 minilectura
Nuevo método mejora la preservación de emociones en los procesos de conversión de voz.
― 6 minilectura
Nuevo método preserva el tono emocional en la conversión de voz para mejorar la interacción humano-computadora.
― 7 minilectura