FlowSep presenta un nuevo método para extraer sonidos usando consultas de lenguaje.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
FlowSep presenta un nuevo método para extraer sonidos usando consultas de lenguaje.
― 6 minilectura
OpenACE ofrece un punto de referencia justo para evaluar códecs de audio en distintas condiciones.
― 6 minilectura
Un nuevo método de zero-shot mejora la precisión de la conversión de voz y minimiza la filtración de sonido.
― 6 minilectura
Nuevo enfoque mejora la isolación de voz en ambientes de audio mixto usando tokens discretos.
― 6 minilectura
El modelo DAC mejora la creación de descripciones de audio con rapidez y diversidad.
― 6 minilectura
Nuevos métodos mejoran el aislamiento acústico de entornos ruidosos sin necesidad de datos etiquetados.
― 6 minilectura
Wave-U-Mamba mejora grabaciones de voz de baja calidad para una comunicación más clara.
― 6 minilectura
Nuevos métodos mejoran la sincronización de audio con escenas de video cambiantes.
― 5 minilectura
Esencial detectar contenido de audio engañoso creado por tecnología.
― 8 minilectura
Nuevos métodos están ayudando a las máquinas a interpretar mejor los sonidos individuales.
― 7 minilectura
Un estudio muestra que los i-vectores pueden competir con modelos complejos en el reconocimiento de hablantes.
― 6 minilectura
Un estudio sobre cómo las elecciones de diseño afectan los modelos de lenguaje de base.
― 8 minilectura
Un nuevo método evalúa modelos de habla auto-supervisados usando medidas de rango.
― 6 minilectura
RF-GML mide la calidad del audio sin necesidad de una señal de referencia.
― 6 minilectura
Técnicas innovadoras mejoran el entrenamiento de modelos de música-texto con recursos limitados.
― 8 minilectura
Nuevos modelos abordan la clasificación de sonido con datos de entrenamiento limitados.
― 6 minilectura
Un nuevo enfoque mejora la detección de audio falso utilizando modelos preentrenados.
― 6 minilectura
Un nuevo método mejora el conteo de fuentes en entornos de señales complejas.
― 6 minilectura
Nuevos diseños de arreglos mejoran la precisión y eficiencia en la detección de dirección de señales.
― 6 minilectura
Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.
― 6 minilectura
Un nuevo método para detectar reflejos tempranos en la sala mejora las experiencias de audio.
― 8 minilectura
Un nuevo marco mejora el reconocimiento de voz y se adapta a varias tareas de habla.
― 5 minilectura
Un enfoque nuevo mejora la detección de grabaciones de audio falsas.
― 6 minilectura
Te presentamos NanoVoice, un modelo de texto a voz rápido y eficiente para audio personalizado.
― 6 minilectura
Un nuevo sistema mejora la identificación de los hablantes en discusiones con varios participantes.
― 6 minilectura
Un nuevo enfoque para mejorar la clasificación a través de la Pérdida de Distribución de Distancia Angular.
― 7 minilectura
Nuevos métodos con modelos de lenguaje mejoran la detección de sonido en medio del ruido de fondo.
― 7 minilectura
Descubre cómo TSE mejora el reconocimiento de voz en entornos ruidosos usando señales de texto.
― 6 minilectura
Un nuevo enfoque mejora la evaluación de la calidad del habla al tener en cuenta el ruido de fondo.
― 6 minilectura
Una mirada a cómo la compresión de rango dinámico mejora las experiencias de audio.
― 7 minilectura
Un nuevo modelo mejora la identificación y localización de sonidos de manera efectiva.
― 8 minilectura
Presentamos VQalAttent, un modelo más sencillo para generar un habla máquina realista.
― 6 minilectura
Investigadores mejoran la detección de voz para búsquedas más rápidas y precisas.
― 6 minilectura
Explorando cómo los trucos de audio confunden a los modelos de lenguaje.
― 7 minilectura
Descubre cómo los CAM están cambiando la forma en que producimos y vivimos la música.
― 7 minilectura
Noro mejora la conversión de voz, haciéndola efectiva incluso en ambientes ruidosos.
― 7 minilectura
Combinar modelos de imagen con sistemas de audio mejora la eficiencia y el rendimiento.
― 8 minilectura
Descubre cómo la separación de fuentes de música y la transcripción cambian la forma en que disfrutamos la música.
― 8 minilectura
Nuevos métodos ayudan a las máquinas a encontrar información clave del contenido hablado.
― 6 minilectura
Nuevos modelos identifican el discurso sintético y combaten el mal uso de la tecnología de voz.
― 6 minilectura