Un nuevo sistema mejora las interacciones de los robots al filtrar el habla superpuesta.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo sistema mejora las interacciones de los robots al filtrar el habla superpuesta.
― 7 minilectura
Últimos artículos
Zipper combina de manera efectiva diferentes tipos de datos para tener modelos de IA más inteligentes.
― 7 minilectura
Usando deep learning para mejorar la monitorización de emisiones acústicas en uniones atornilladas.
― 9 minilectura
Un nuevo enfoque para combinar canto y baile a través de técnicas informáticas avanzadas.
― 7 minilectura
Descubre cómo la pintura de voz está restaurando la calidad del audio en varios campos.
― 8 minilectura
Un nuevo sistema mejora la claridad del habla en entornos con múltiples hablantes.
― 6 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen emociones en el habla.
― 7 minilectura
El modelo Frieren mejora la calidad de audio y la sincronización para videos.
― 7 minilectura
Un nuevo método genera sonidos únicos a partir de texto usando un sintetizador sencillo.
― 9 minilectura
Un nuevo método mejora la traducción de voz en entornos ruidosos y mantiene la expresividad.
― 5 minilectura
Un nuevo conjunto de datos mejora el estudio de la identificación de Raga en la música india.
― 7 minilectura
Seed-TTS crea habla realista a partir de texto para varias aplicaciones.
― 5 minilectura
Un nuevo método mejora la conversión de voz a canto usando aprendizaje auto-supervisado.
― 8 minilectura
StreamSpeech mejora la traducción de voz en tiempo real con eficiencia y calidad.
― 5 minilectura
Un nuevo modelo mejora el reconocimiento de voz usando múltiples métodos de decodificación.
― 8 minilectura
Un estudio sobre cómo mejorar el reconocimiento de voz automática (ASR) para dialectos árabes usando técnicas de modelos eficientes.
― 6 minilectura
Te presento BLSP-Emo, un modelo que entiende el habla y las emociones para tener mejores interacciones.
― 6 minilectura
Un estudio reciente replica hallazgos clave sobre la interpretación de datos usando sonido y visuales.
― 7 minilectura
Un nuevo modelo genera música usando tanto texto como información visual.
― 8 minilectura
Un sistema que conecta sonidos con imágenes, mejorando la comprensión de las máquinas.
― 7 minilectura
El nuevo modelo ARDiT mejora la síntesis de texto a voz y la edición de audio.
― 7 minilectura
Nuevos métodos mejoran la claridad al aislar voces de mezclas de audio.
― 5 minilectura
Te presento SPICE, una tarea para mejorar las interacciones de la IA usando información contextual.
― 9 minilectura
La investigación presenta el conjunto de datos MOSA, mejorando la comprensión de los aspectos visuales y auditivos de la música.
― 8 minilectura
mHuBERT-147 procesa el habla en varios idiomas de manera eficiente.
― 5 minilectura
Un nuevo enfoque para la subtitulación de audio reduce la dependencia de datos emparejados.
― 7 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen emociones en el habla humana.
― 7 minilectura
Una mirada a nuevos métodos para entender el habla entrecortada durante las conversaciones.
― 9 minilectura
Investigando vulnerabilidades en métodos de marca de agua de audio contra amenazas del mundo real.
― 9 minilectura
PianoMotion10M ofrece movimientos de manos detallados para ayudar a los que aprenden piano.
― 7 minilectura
Un nuevo modelo mejora la coincidencia de sonido con acciones visuales en videos.
― 13 minilectura
Nuevo modelo mejora experiencias de audio realistas en entornos virtuales.
― 8 minilectura
Este estudio analiza métodos de audio para rastrear el movimiento de peatones en áreas urbanas.
― 9 minilectura
Un nuevo conjunto de datos mejora la creación de audio foley para contenido multimedia.
― 8 minilectura
Nuevos métodos mejoran el reconocimiento de voz en entornos ruidosos usando técnicas adaptativas.
― 8 minilectura
SPEAR predice el comportamiento del sonido en espacios 3D usando una mínima recolección de datos.
― 7 minilectura
Un nuevo método mejora la traducción de habla en varios idiomas al inglés.
― 6 minilectura
Un nuevo método mejora la precisión de verificación de hablantes en entornos de radio difíciles.
― 8 minilectura
Nuevo método apunta a cambios de ritmo para ataques de habla sigilosos.
― 7 minilectura
GAMA mejora el procesamiento de audio al fusionar conocimientos de sonido y lenguaje.
― 7 minilectura
Un nuevo sistema ayuda a separar el habla del ruido para una comunicación más clara.
― 7 minilectura