El aprendizaje por transferencia mejora la clasificación de audio para la detección de sonidos submarinos.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
El aprendizaje por transferencia mejora la clasificación de audio para la detección de sonidos submarinos.
― 7 minilectura
Un nuevo modelo crea audio que coincide con el video, mejorando las experiencias mediáticas.
― 5 minilectura
Un método para mejorar el reconocimiento automático de voz combinando listas de palabras clave con modelos de lenguaje.
― 5 minilectura
Un estudio sobre técnicas de imitación vocal usando tecnología para mejorar la comunicación.
― 6 minilectura
Aprende a entrenar modelos de voz de manera efectiva con menos recursos etiquetados.
― 8 minilectura
Un análisis de la terminología de género en la tecnología del habla y sus implicaciones sociales.
― 8 minilectura
Un nuevo marco mejora la detección de eventos sonoros que se superponen en entornos de audio complejos.
― 7 minilectura
Investigación sobre cómo mejorar la identificación de sonidos de aves usando técnicas de aprendizaje automático.
― 8 minilectura
Un nuevo método mejora la creación automática de versiones de piano usando la tecnología de transcripción musical existente.
― 7 minilectura
Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.
― 6 minilectura
El proyecto MultiMed mejora el reconocimiento de voz automático para una mejor comunicación en el cuidado de la salud.
― 7 minilectura
Un enfoque nuevo para la evaluación de la calidad de audio sin necesitar referencias limpias.
― 7 minilectura
El marco ECHO mejora la precisión en la clasificación de sonidos usando etiquetas estructuradas y un proceso de aprendizaje en dos etapas.
― 6 minilectura
Un nuevo método mejora la claridad del habla al integrar información visual.
― 6 minilectura
Un nuevo enfoque mejora la estimación de la dirección del sonido para altavoces en movimiento en entornos difíciles.
― 10 minilectura
La Recuperación de Momentos de Audio permite localizar momentos específicos en grabaciones largas.
― 6 minilectura
Safe Guard detecta discurso de odio en tiempo real durante interacciones de voz en VR social.
― 7 minilectura
La IA está evolucionando para tener conversaciones más naturales.
― 6 minilectura
Un enfoque novedoso utiliza MRI en tiempo real para visualizar los movimientos de producción del habla.
― 6 minilectura
Un nuevo método para detectar reflejos tempranos en la sala mejora las experiencias de audio.
― 8 minilectura
Un proyecto que desarrolla conjuntos de datos de voz y texto para idiomas con recursos limitados.
― 6 minilectura
Un nuevo marco mejora el reconocimiento de voz y se adapta a varias tareas de habla.
― 5 minilectura
Se necesitan nuevos métodos para detectar tecnologías avanzadas de voz deepfake.
― 7 minilectura
Nuevos métodos aumentan la precisión para identificar sonidos de animales con datos limitados.
― 6 minilectura
Nuevo método mejora la integración del sonido virtual en entornos de AR.
― 8 minilectura
Un nuevo método busca preservar la privacidad de la voz mientras permite una comunicación efectiva.
― 5 minilectura
Nuevos métodos mejoran el reconocimiento de voz para lenguas de pocos recursos sin texto.
― 5 minilectura
Nuevos métodos mejoran la precisión en los sistemas de reconocimiento de voz usando comprensión fonética.
― 6 minilectura
Este marco mejora las animaciones en tiempo real al sincronizar el habla y los gestos de manera fluida.
― 5 minilectura
Nuevas características acústicas mejoran el rendimiento de los sistemas ASR en entornos ruidosos.
― 5 minilectura
Una nueva función de pérdida mejora la calidad del audio al alinear fase y magnitud.
― 7 minilectura
Un nuevo modelo de TTS agrega profundidad emocional al habla generada por computadora.
― 6 minilectura
Evaluando modelos de reconocimiento de voz para sesiones de diagnóstico de autismo.
― 7 minilectura
Los métodos recientes mejoran la claridad y calidad del audio usando modelos avanzados.
― 7 minilectura
Un enfoque nuevo mejora la detección de grabaciones de audio falsas.
― 6 minilectura
ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.
― 8 minilectura
Explorando métodos para adaptar RNNs a diferentes tasas de muestreo de audio.
― 7 minilectura
Nuevo modelo consigue una transcripción de voz más rápida sin sacrificar la precisión.
― 5 minilectura
Descubre cómo los embeddings Matryoshka mejoran la eficiencia y flexibilidad del reconocimiento de hablantes.
― 6 minilectura
Te presentamos NanoVoice, un modelo de texto a voz rápido y eficiente para audio personalizado.
― 6 minilectura