Un estudio revela amenazas graves en el reconocimiento de voz usando muestras de morfología.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un estudio revela amenazas graves en el reconocimiento de voz usando muestras de morfología.
― 6 minilectura
Un conjunto de datos detallado que combina las sonatas de Mozart con interpretaciones de piano y anotaciones de expertos.
― 7 minilectura
Un nuevo diseño de auriculares mejora la claridad del sonido usando tecnología de conducción ósea.
― 10 minilectura
Un nuevo modelo liviano mejora la estimación de la tonalidad usando técnicas de aprendizaje auto-supervisado.
― 8 minilectura
Un nuevo enfoque para mejorar la identificación y análisis de segmentos musicales.
― 6 minilectura
Nuevos métodos desarrollados para identificar canciones falsas ante la creciente preocupación.
― 6 minilectura
Cleancoder mejora los sistemas ASR al reducir el ruido de fondo para una comprensión del habla más clara.
― 5 minilectura
RADIO crea caras que hablan de forma realista usando solo una imagen de referencia.
― 7 minilectura
RoDia ofrece muestras de audio súper importantes para identificar dialectos rumanos.
― 6 minilectura
Explorando cómo los gestos y expresiones mejoran nuestra comprensión del idioma hablado.
― 8 minilectura
Una mirada a mezclar música, combinando habilidades técnicas con visión artística.
― 5 minilectura
Explorando nuevos métodos en detección y localización de sonido usando datos sintéticos.
― 6 minilectura
Un nuevo sistema ayuda a los músicos a experimentar el sonido en un escenario virtual.
― 8 minilectura
Nuevo método mejora la detección de segmentos de audio falsos en grabaciones.
― 6 minilectura
Las computadoras están aprendiendo a separar el ritmo y la armonía en la música para aplicaciones creativas.
― 5 minilectura
El MuLanTTS de Microsoft ofrece capacidades de texto a voz en francés que suenan naturales y expresivas.
― 5 minilectura
Nuevos conjuntos de datos y métodos mejoran la clasificación de vehículos para una mejor gestión del tráfico.
― 7 minilectura
Nuevos métodos mejoran la precisión y velocidad en la tecnología de reconocimiento de voz.
― 7 minilectura
Un nuevo sintetizador mejora la generación de efectos de sonido realistas para los medios.
― 7 minilectura
Un nuevo enfoque mejora la estimación de confianza en los sistemas de ASR para más precisión.
― 5 minilectura
Presentamos un marco para una síntesis de voz más natural y expresiva.
― 7 minilectura
Aprende cómo la tecnología ayuda a clasificar géneros musicales de manera eficiente.
― 7 minilectura
Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.
― 6 minilectura
Un nuevo método mejora la creación de videos con cabezas hablantes que expresan emociones.
― 8 minilectura
Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.
― 6 minilectura
El modelo CLAP conecta el procesamiento de audio y texto para varias aplicaciones.
― 5 minilectura
Un proyecto tiene como objetivo mejorar el procesamiento del habla en francés usando aprendizaje auto-supervisado.
― 6 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen el ritmo y la emoción del habla.
― 8 minilectura
Un nuevo enfoque mejora la estimación del sonido en espacios con objetos que disipan.
― 7 minilectura
Examina cómo la indecibilidad influye en la composición y producción musical hoy en día.
― 5 minilectura
Este artículo explora los avances en la diarización de hablantes usando modelos de lenguaje para mejorar la precisión.
― 6 minilectura
Este estudio mejora la capacidad de los sistemas de reconocimiento de voz para entender el habla de los niños.
― 7 minilectura
Los investigadores están explorando tecnología de detección de audio para mejorar la identificación de peatones en áreas urbanas.
― 6 minilectura
Nuevo método mejora la localización de fuentes de sonido y la separación de campos.
― 7 minilectura
Un nuevo método mejora la síntesis del sonido de los tambores al centrarse en los elementos transitorios agudos.
― 7 minilectura
Los investigadores están desarrollando datos de voz sintética para proteger la privacidad en el reconocimiento de voz.
― 7 minilectura
VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.
― 5 minilectura
Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.
― 5 minilectura
EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.
― 6 minilectura
Un estudio sobre el uso de aprendizaje automático para identificar los sonidos de los niños para la evaluación del TDAH.
― 6 minilectura