Informática - Sonido

RSS

Sonido MuPT: Avanzando en la Generación de Música con Notación ABC

MuPT utiliza la notación ABC para generar música de manera efectiva con IA.

2025-08-12T09:00:00+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando el Aprendizaje de Audio con M2D y M2D-X

Nuevos métodos mejoran la representación de audio a través de técnicas de aprendizaje auto-supervisado.

2025-08-12T07:22:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Reconstrucción del Campo Sonoro con IA

Un método que usa IA mejora la representación del sonido en diferentes entornos.

2025-08-12T00:54:10+00:00 ― 8 minilectura

Física clásica Entendiendo los Momentos Espectrales en Pruebas Electromagnéticas

Explora el papel de los momentos espectrales en las pruebas de cámara de reverberación y el impacto del ruido.

2025-08-12T00:28:33+00:00 ― 7 minilectura

Procesado de Audio y Voz Modelo Eficiente de Transcripción de Piano en Tiempo Real

Un nuevo sistema para una transcripción de piano en tiempo real, precisa y ligera.

2025-08-12T00:05:35+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Any2Point: Conectando la comprensión 3D en modelos de IA

Un nuevo marco mejora la comprensión de la IA sobre los espacios 3D.

2025-08-11T19:14:05+00:00 ― 8 minilectura

Sonido Avances en la tecnología de edición de atributos de voz

Nuevo modelo permite un control preciso de las cualidades de la voz mientras se mantiene el contenido.

2025-08-11T18:25:30+00:00 ― 5 minilectura

Sonido Avanzando la IA en la generación de texto a audio

Un estudio sobre cómo mejorar los audios a partir de indicaciones de texto usando optimización de preferencias.

2025-08-11T07:05:20+00:00 ― 8 minilectura

Sonido Avances en la generación automática de música usando IA

Explorando los últimos avances en herramientas de IA para crear música.

2025-08-10T16:30:50+00:00 ― 6 minilectura

Sonido Mejorando el etiquetado de música con incrustaciones de palabras musicales

Un nuevo enfoque mejora el etiquetado y la recuperación de música al combinar términos de lenguaje general y de música.

2025-08-10T06:47:50+00:00 ― 12 minilectura

Procesado de Audio y Voz FlashSpeech: Un Salto en la Sintetización de Voz

FlashSpeech ofrece soluciones de síntesis de voz rápidas y de alta calidad.

2025-08-10T03:33:30+00:00 ― 8 minilectura

Sonido Avances en la detección de deepfakes con el marco RAD

Un nuevo método mejora la detección de deepfakes de audio usando referencias de muestras similares.

2025-08-10T01:07:45+00:00 ― 7 minilectura

Sonido Midiendo la virtuosidad en la interpretación de guitarra eléctrica

Este estudio analiza señales de sonido para medir la virtuosidad entre guitarristas eléctricos.

2025-08-09T18:39:05+00:00 ― 6 minilectura

Sonido Análisis de voz innovador para la detección temprana del Parkinson

La investigación muestra que usar análisis de voz para identificar la enfermedad de Parkinson temprano tiene potencial.

2025-08-09T16:24:42+00:00 ― 6 minilectura

Sonido Navegando vulnerabilidades en el reconocimiento de emociones en el habla

Este estudio examina las debilidades de los modelos SER frente a ataques adversariales en diferentes idiomas.

2025-08-08T21:35:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en la extracción de hablantes objetivo de audio y video con SEANet

SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.

2025-08-08T20:47:20+00:00 ― 8 minilectura

Sonido SemantiCodec: El siguiente paso en la tecnología de audio

Un nuevo códec de audio que ofrece compresión de alta calidad y contenido semántico rico.

2025-08-08T19:10:10+00:00 ― 8 minilectura

Sonido Nueva herramienta analiza contenido de audio y video

Una herramienta que combina análisis de audio y video para identificar eventos.

2025-08-08T12:41:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Midiendo la Absorción de Sonido: Un Nuevo Método

Un método para medir cómo los materiales absorben el sonido de manera efectiva.

2025-08-08T10:46:48+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de audífonos con aprendizaje profundo

Nuevos métodos mejoran la claridad del habla en los audífonos mediante técnicas de aprendizaje profundo.

2025-08-08T01:21:20+00:00 ― 7 minilectura

Sonido Localización de Fuentes de Sonido: Técnicas y Aplicaciones

Aprende sobre técnicas de localización de sonido y sus usos en diferentes campos.

2025-08-07T23:44:10+00:00 ― 5 minilectura

Sonido Abordando el aumento de la detección de audio deepfake

Un nuevo conjunto de datos y métodos mejoran la detección de deepfakes de audio generados por ALM.

2025-08-07T06:43:55+00:00 ― 7 minilectura

Computación y lenguaje Nuevo método de ataque silencia sistemas ASR

Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.

2025-08-07T03:29:35+00:00 ― 7 minilectura

Sonido Nuevo dispositivo mejora la conversación en ambientes ruidosos

Un dispositivo ayuda a enfocarse en voces específicas en lugares concurridos.

2025-08-06T19:23:45+00:00 ― 7 minilectura

Sonido Avanzando en la Edición de Audio con Modelos de Difusión

Un nuevo método mejora la edición de audio usando modelos de difusión para cambios precisos.

2025-08-06T16:09:25+00:00 ― 6 minilectura

Computación y lenguaje Integrando Modelos de Audio y Lenguaje: SpeechVerse

SpeechVerse conecta la comprensión de audio y el procesamiento del lenguaje para mejorar la interacción humano-computadora.

2025-08-06T06:26:25+00:00 ― 7 minilectura

Sonido Evaluando el sesgo en la tecnología de asistentes de voz

Un nuevo conjunto de datos destaca las diferencias de rendimiento entre grupos demográficos que utilizan asistentes de voz.

2025-08-06T02:23:30+00:00 ― 8 minilectura

Computación y lenguaje Examinando la seguridad de los modelos de lenguaje

Este artículo investiga las vulnerabilidades en los modelos de voz y formas de mejorar su seguridad.

2025-08-05T23:09:10+00:00 ― 6 minilectura

Aprendizaje automático Abordando la Alucinación en Modelos de IA

Entender y mitigar las alucinaciones en la IA para un rendimiento confiable.

2025-08-05T17:29:05+00:00 ― 9 minilectura

Sonido Nuevo método usa gráficos para el análisis de música

Un nuevo enfoque utiliza redes neuronales de convolución gráfica para un análisis eficiente de datos de música.

2025-08-05T15:51:55+00:00 ― 11 minilectura

Procesado de Audio y Voz Avances en técnicas de coincidencia audio-texto

Nuevos métodos mejoran las conexiones entre clips de audio y descripciones de texto.

2025-08-05T14:14:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Transcripción de la Voz Cantada con el Modelo ROSVOT

ROSVOT mejora la precisión al transcribir voces cantando, incluso en ambientes ruidosos.

2025-08-05T10:11:50+00:00 ― 7 minilectura

Inteligencia artificial El futuro de la generación multimodal con LLMs

Explora cómo los modelos de lenguaje grandes mejoran la creatividad a través de la generación multimedia.

2025-08-04T21:12:12+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Un Nuevo Enfoque para la Generación de Contenido Audiovisual

Presentando un modelo que genera audio y video sincronizados con niveles de ruido mezclados.

2025-08-04T14:45:50+00:00 ― 6 minilectura

Interacción Persona-Ordenador Avanzando en la Comunicación de Robots: Solución para el Hablar Simultáneo

Un nuevo sistema mejora las interacciones de los robots al filtrar el habla superpuesta.

2025-08-04T13:57:15+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Un Modelo Simple para la Generación Audio-Visual

Este artículo habla de un nuevo modelo sencillo para generar audio a partir de imágenes y viceversa.

2025-08-04T09:05:45+00:00 ― 6 minilectura

Aprendizaje automático Avances en el Reconocimiento Automático de Voz con Modelos de Lenguaje de Desruido

Los modelos de lenguaje de eliminación de ruido mejoran la corrección de errores en los sistemas de reconocimiento de voz usando datos sintéticos.

2025-08-03T22:34:10+00:00 ― 9 minilectura

Sonido NeRAF: Fusionando sonido y visuales para realismo

NeRAF crea sonidos y visuales sincronizados para experiencias inmersivas en varios ámbitos.

2025-08-03T07:11:05+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Enfoque innovador para la generación conjunta de audio y video

Un nuevo método mejora la alineación de audio y video usando modelos preentrenados.

2025-08-03T04:45:20+00:00 ― 7 minilectura

Sonido Mejorando el Monitoreo de Juntas Atornilladas con Aprendizaje Profundo

Usando deep learning para mejorar la monitorización de emisiones acústicas en uniones atornilladas.

2025-08-02T21:28:05+00:00 ― 9 minilectura