Informática - Sonido

RSS

Procesado de Audio y Voz Avances en la Cancelación de Eco Acústico con CMNet

CMNet mejora la claridad de la voz al reducir el eco en los dispositivos de comunicación.

2025-10-04T06:38:40+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Objetivos Submarinos con Redes Neuronales

Un nuevo método mejora la clasificación de sonidos submarinos de barcos usando redes neuronales.

2025-10-04T05:01:30+00:00 ― 6 minilectura

Sonido Avances en la tecnología de audífonos

La investigación busca mejorar la claridad en los audífonos para una mejor comunicación.

2025-10-04T02:35:45+00:00 ― 7 minilectura

Sonido Avances en el Mejora del Habla Usando Redes Neuronales de Picos

Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.

2025-10-03T21:44:15+00:00 ― 6 minilectura

Sonido Entendiendo las vocalizaciones de las vacas durante el estrés

La investigación destaca la comunicación de las vacas para mejorar las prácticas de la ganadería lechera.

2025-10-03T15:15:35+00:00 ― 6 minilectura

Sonido Presentamos MuReNN: Un Nuevo Modelo para el Procesamiento de Audio

MuReNN combina modelos paramétricos y no paramétricos para mejorar el análisis de audio.

2025-10-03T14:14:43+00:00 ― 5 minilectura

Aprendizaje automático BioLingual: Una Nueva Era en Bioacústica

Revolucionando la investigación sobre la comunicación animal con integración innovadora de audio y lenguaje.

2025-10-03T11:32:00+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en Mejora de Voz con PCNN

Presentamos un nuevo modelo para hablar más claro en ambientes ruidosos.

2025-10-03T07:58:20+00:00 ― 6 minilectura

Multimedia Avances en la coincidencia acústica visual

Un nuevo método mejora la coincidencia de audio usando imágenes, aumentando el realismo en los entornos de audio.

2025-10-03T03:55:25+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Técnicas de Mejora del Sonido

Mejorando la calidad del habla a través de métodos innovadores y conjuntos de datos multilingües.

2025-10-02T23:52:30+00:00 ― 7 minilectura

Sonido Detección Efectiva de Audio Deepfake

Nuevos sistemas están diseñados para detectar grabaciones de audio falsas con mejor precisión.

2025-10-02T18:12:25+00:00 ― 7 minilectura

Sonido Avances en Diarización de Hablar a Través de la Integración Audio-Visual

Nuevos sistemas mejoran la identificación de hablantes usando datos de audio y visuales.

2025-10-02T15:46:40+00:00 ― 5 minilectura

Sonido MoisesDB: Un gran avance en la separación de fuentes musicales

MoisesDB ofrece un conjunto de datos detallado para la separación avanzada de sonidos en la música.

2025-10-02T09:18:00+00:00 ― 7 minilectura

Sonido Avanzando la subtitulación musical con modelos de lenguaje grandes

Usando LLMs para crear un montón de datos para la subtitulación de música.

2025-10-02T08:29:25+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de entrenamiento de pronunciación

Los investigadores están mejorando el entrenamiento de pronunciación con nuevas tecnologías para los que aprenden idiomas.

2025-10-02T07:40:50+00:00 ― 6 minilectura

Sonido Avances en la tecnología de transferencia de estilo de voz

HierVST transforma voces sin problemas, mejorando la calidad de audio sin necesidad de muchos datos.

2025-10-02T05:15:05+00:00 ― 6 minilectura

Multimedia Avances en la estimación de compromiso para conversaciones

La investigación desarrolla un modelo para medir con precisión la participación en conversaciones.

2025-10-01T21:57:50+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones DAVIS: Un Nuevo Enfoque para la Separación de Sonido

DAVIS ofrece una forma nueva de enfrentar la separación de sonido audio y visual.

2025-10-01T19:32:05+00:00 ― 6 minilectura

Sonido Mejorando las Técnicas de Segmentación Audiovisual

Un nuevo método mejora la identificación precisa de objetos que producen sonido en videos.

2025-10-01T13:52:00+00:00 ― 8 minilectura

Sonido Avances en Texto a Voz con DiffProsody

DiffProsody mejora la velocidad y calidad de la síntesis de voz a través de una generación de prosodia innovadora.

2025-10-01T13:03:25+00:00 ― 5 minilectura

Sonido Abordando la Guerra de la Sonoridad con Redes De-limitadoras

Nueva tecnología busca restaurar la calidad de la música que se perdió por la compresión de volumen.

2025-10-01T02:31:50+00:00 ― 6 minilectura

Sonido Sistema Automatizado para Identificar la Afasia

Nuevo método promete identificar más rápido trastornos del habla como la afasia.

2025-09-30T21:40:20+00:00 ― 6 minilectura

Criptografía y seguridad Técnicas de sonido inaudible para manipulación del habla

Nuevo método usa sonidos ultrasónicos para confundir sistemas de reconocimiento de voz sin ser detectado.

2025-09-30T19:14:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en tecnología de texto a voz

Nuevos métodos mejoran la calidad del habla sintética usando aprendizaje auto-supervisado.

2025-09-30T17:37:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Refuerzo de Palabras Clave

Un nuevo método mejora la transcripción de palabras clave raras en conversaciones de negocios.

2025-09-30T10:20:10+00:00 ― 7 minilectura

Sonido Avanzando el Reconocimiento de Voz con Aprendizaje Federado

El Aprendizaje Federado mejora el reconocimiento de voz mientras mantiene los datos del usuario privados.

2025-09-30T08:43:00+00:00 ― 6 minilectura

Sonido MusicLDM: Un Nuevo Enfoque para la Generación de Música a Partir de Texto

MusicLDM transforma texto en música original, ofreciendo nuevas formas de creatividad.

2025-09-30T05:28:40+00:00 ― 9 minilectura

Sonido Mejorando las técnicas de extracción de melodía vocal con aprendizaje profundo

Nuevos métodos mejoran la precisión para extraer melodías cantadas de audio mezclado.

2025-09-30T01:25:45+00:00 ― 9 minilectura

Computación y lenguaje Avances en la tecnología de subtitulado de audio

Nuevos métodos buscan mejorar la subtitulación de audio para mayor precisión y eficiencia.

2025-09-30T00:25:00+00:00 ― 6 minilectura

Sonido Avances en técnicas de mejora de audio

Nuevo modelo mejora la claridad del habla en entornos ruidosos usando métodos innovadores.

2025-09-29T22:11:25+00:00 ― 6 minilectura

Sonido Analizando canciones populares coreanas a través de la tecnología

Un estudio sobre las canciones folclóricas coreanas utilizando métodos analíticos modernos.

2025-09-29T21:22:50+00:00 ― 10 minilectura

Gráficos DiffDance: Una Nueva Era en la Generación de Baile

DiffDance crea secuencias de baile detalladas que se ajustan bien a la música.

2025-09-29T16:31:20+00:00 ― 7 minilectura

Sonido Abordando el sesgo de género en la transcripción de voces cantadas

Examinando la equidad en la tecnología de transcripción de voces cantantes entre géneros.

2025-09-29T15:42:45+00:00 ― 9 minilectura

Sonido Avances en la personalización de palabras clave para sistemas de reconocimiento de voz

SeACo-Paraformer trae flexibilidad y precisión a la tecnología de reconocimiento de voz.

2025-09-29T14:05:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Examinando la calidad de la voz y su impacto

Este estudio explora métodos de clasificación de calidad de voz y su importancia en la comunicación.

2025-09-29T12:28:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de control activo de ruido

Aprende cómo los nuevos algoritmos mejoran las técnicas de cancelación de ruido para diferentes aplicaciones.

2025-09-29T05:59:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Nueva herramienta mide la calidad del audio con análisis de video

AudioVMAF combina métricas de video para mejorar la evaluación de la calidad del audio.

2025-09-29T01:56:50+00:00 ― 7 minilectura

Sonido Avances en la detección de audio falso con RAWM

Un nuevo método mejora la detección de audio falso usando modificación adaptativa de pesos.

2025-09-29T01:08:15+00:00 ― 7 minilectura

Criptografía y seguridad La creciente necesidad de esteganálisis en la seguridad de la información

La esteganálisis ayuda a detectar mensajes ocultos en multimedia, asegurando una comunicación segura.

2025-09-28T23:31:05+00:00 ― 5 minilectura

Multimedia TranSTYLer: Un Salto en la Comunicación Virtual

Transformando gestos para agentes virtuales con significado preservado.

2025-09-28T18:39:35+00:00 ― 7 minilectura