Últimos artículos para Audio

Sonido Avanzando en la generación de audio con el conjunto de datos Sound-VECaps

Nuevo conjunto de datos mejora la generación de audio a partir de descripciones de texto detalladas.

2025-07-21T07:26:30+00:00 ― 6 minilectura

Sonido Nuevos conjuntos de datos para el reconocimiento de emociones en la música

Presentamos datasets MERGE para mejorar la clasificación de emociones en la música.

2025-07-19T20:37:25+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Tecnología Deepfake: Oportunidades y Riesgos que Vienen

Una mirada a los métodos de creación y detección de deepfakes.

2025-07-17T11:43:30+00:00 ― 8 minilectura

Gráficos El impacto de la retroalimentación de colisiones en la realidad virtual

Examinando cómo la retroalimentación durante colisiones moldea la experiencia del usuario en espacios VR llenos de gente.

2025-07-16T01:05:48+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método para detectar deepfakes

Un nuevo enfoque mejora la detección de deepfakes usando análisis audiovisual.

2025-07-15T12:10:10+00:00 ― 7 minilectura

Sonido Generación de sonido innovadora para modelos humanos en 3D

Un nuevo método mejora la creación de sonido para modelos humanos 3D realistas.

2025-07-15T00:01:25+00:00 ― 8 minilectura

Computación y lenguaje Mejorando la detección de la salud mental con datos multimodales

Un nuevo método combina texto, emociones y audio para mejorar la detección de la salud mental.

2025-07-14T06:42:00+00:00 ― 8 minilectura

Inteligencia artificial Charla de emociones: Soporte de audio para sentimientos

Un proyecto que ofrece apoyo emocional a través de respuestas de audio para quienes lo necesiten.

2025-07-14T05:46:42+00:00 ― 6 minilectura

Sonido Generación de Audio Abierto: Un Nuevo Modelo

Un nuevo modelo de texto a audio usando solo datos públicos.

2025-07-13T11:35:10+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones OmniBind: Un Nuevo Enfoque para Datos Multimodales

OmniBind integra varios tipos de datos para mejorar la comprensión y generación de contenido.

2025-07-12T14:16:42+00:00 ― 6 minilectura

Procesado de Audio y Voz Codecs de voz y preservación emocional

Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.

2025-07-12T06:26:10+00:00 ― 7 minilectura

Sonido Avanzando en la detección de compresión de audio con pérdida

Un estudio sobre cómo mejorar los métodos para detectar la compresión de audio con pérdidas para una mejor calidad de sonido.

2025-07-07T12:15:55+00:00 ― 7 minilectura

Sonido ChordSync: Sincronizando Acordes Musicales con Audio

Un nuevo modelo que sincroniza las anotaciones de acordes con el audio de la música de manera fluida.

2025-07-06T22:30:00+00:00 ― 7 minilectura

Sonido Nuevo método para detectar deepfakes usando audio y video

Un marco que identifica de manera efectiva contenido deepfake a través de un análisis combinado de audio y visual.

2025-07-06T08:44:05+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Modelo Innovador para Diagnosticar la Depresión

Un nuevo enfoque combina audio, video y datos de texto para un diagnóstico efectivo de la depresión.

2025-07-06T04:53:12+00:00 ― 9 minilectura

Robótica Presentamos VAT-CMR: Un Nuevo Enfoque para la Recuperación Cross-Modal

VAT-CMR permite que los robots recuperen objetos usando datos visuales, de audio y táctiles.

2025-07-04T20:45:36+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la animación facial 3D impulsada por audio

UniTalker une datasets para mejorar la precisión de la animación facial.

2025-07-03T22:22:36+00:00 ― 8 minilectura

Computación y lenguaje Avances en Sistemas de Diálogo Hablado

Style-Talker mejora las conversaciones entre humanos y máquinas a través de la profundidad emocional.

2025-07-01T13:45:15+00:00 ― 10 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la detección de deepfakes con detalles finos

Un nuevo enfoque se centra en inconsistencias sutiles en la detección de deepfakes.

2025-07-01T04:02:15+00:00 ― 7 minilectura

Interacción Persona-Ordenador Combinando datos para una mejor evaluación de la salud mental

Un nuevo método combina EEG, audio y expresiones faciales para evaluar la salud mental.

2025-06-27T18:23:00+00:00 ― 7 minilectura

Sonido Desafíos en la detección de señales de voz parcialmente falsas

Una mirada a las complejidades de identificar pistas de audio mezcladas.

2025-06-25T06:20:10+00:00 ― 7 minilectura

Sonido Avances en el Control de Generación de Audio

Un nuevo modelo separa el timbre y la estructura para crear mejor audio.

2025-06-23T17:24:32+00:00 ― 8 minilectura

Robótica RoboMNIST: Un Nuevo Conjunto de Datos para el Reconocimiento de Actividades de Robots

RoboMNIST ayuda a los robots a reconocer varias actividades usando WiFi, video y audio.

2025-06-22T09:30:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en tecnología de audio: Presentando X-Codec

X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.

2025-06-21T15:41:45+00:00 ― 7 minilectura

Sonido Avances en la tecnología de extracción de voz del hablante objetivo

Nuevos métodos mejoran la separación de voces en entornos ruidosos.

2025-06-20T13:47:05+00:00 ― 5 minilectura

Sonido Nuevo Método para Generar Habla de Manera Eficiente

Un nuevo sistema genera voz a partir de texto usando datos mínimos.

2025-06-19T04:27:24+00:00 ― 5 minilectura

Sonido Marcas de agua en modelos generativos de audio: un nuevo enfoque

Nuevos métodos de marca de agua protegen a los creadores en modelos generativos de audio.

2025-06-18T23:43:40+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la generación de movimiento usando textos y audio

Un nuevo marco mejora la generación de movimiento para animaciones y experiencias virtuales.

2025-06-17T13:21:06+00:00 ― 7 minilectura

Sonido Nuevo modelo mejora la calidad de audio al eliminar los sonidos de respiración

Un nuevo modelo simplifica la producción de audio al eliminar automáticamente los sonidos de respiración.

2025-06-17T10:28:50+00:00 ― 7 minilectura

Sonido Nuevo enfoque para la transferencia de timbre en la música

Un nuevo método mejora la transformación de audio mientras preserva la melodía y la calidad del sonido.

2025-06-16T05:19:50+00:00 ― 7 minilectura

Sonido Redes Neuronales en el Modelado de Reverberación de Primavera

Este estudio evalúa redes neuronales para replicar las características de la reverberación de muelles.

2025-06-15T20:24:12+00:00 ― 9 minilectura

Sonido Avances en la tecnología de texto a voz emocional

ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.

2025-06-15T05:50:55+00:00 ― 6 minilectura

Computación y lenguaje Avances en la segmentación de temas en noticias habladas

Nuevos métodos mejoran el acceso a noticias habladas al segmentar mejor los temas.

2025-06-15T00:59:25+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la Extracción de Sonido Objetivo con SoloAudio

SoloAudio mejora la extracción de sonido usando técnicas avanzadas y datos sintéticos.

2025-06-13T17:24:40+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de detección de hablantes activos

Nuevo modelo mejora la detección de hablantes en tiempo real y la eficiencia en la comunicación.

2025-06-12T14:43:12+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Generación de Audio Basada en Estilos

Un nuevo modelo mejora la generación de audio usando texto detallado y sonidos como prompts.

2025-06-11T08:43:50+00:00 ― 7 minilectura

Sonido MusicLIME: Una Nueva Herramienta para el Análisis Musical con IA

MusicLIME ayuda a explicar el enfoque de la IA para analizar música a través de audio y letras.

2025-06-10T00:20:30+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones V-AURA: Avanzando la Integración de Video a Audio

Un nuevo modelo crea audio que coincide con el video, mejorando las experiencias mediáticas.

2025-06-05T23:59:05+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el aprendizaje en línea con la alineación de video y diapositivas

Un nuevo enfoque integra videos de clases y diapositivas para mejorar la participación de los estudiantes.

2025-06-02T05:17:45+00:00 ― 7 minilectura

Sonido Integrando datos audio-visuales para el procesamiento de voz

Este estudio analiza cómo el audio, el video y el texto funcionan juntos en el reconocimiento de voz.

2025-05-30T15:13:22+00:00 ― 8 minilectura