Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.
― 6 minilectura
Un nuevo método mejora el reconocimiento de sonido y la localización de fuentes sin etiquetas.
― 6 minilectura
Un nuevo estándar para mejorar la precisión del ASR usando modelos de lenguaje.
― 7 minilectura
Nuevos métodos mejoran la traducción de habla al centrarse en la información contextual.
― 6 minilectura
Un nuevo método mejora el reconocimiento de voz para usuarios que cambian de código.
― 6 minilectura
Descubre cómo el análisis de sonido ayuda a identificar problemas en máquinas de manera eficiente.
― 7 minilectura
Este proyecto mejora la traducción de voz en tiempo real y los sistemas de subtitulado automático.
― 5 minilectura
Explorando cómo la agudeza de los mínimos influye en el rendimiento del modelo con datos de audio no vistos.
― 6 minilectura
Un nuevo método mejora la verificación de hablantes al combinar datos de audio y visuales.
― 6 minilectura
Un estudio sobre el uso de transformadores para un etiquetado y representación musical efectiva.
― 8 minilectura
Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.
― 8 minilectura
Un nuevo enfoque para evaluar la dificultad de la música para piano usando imágenes de partituras.
― 7 minilectura
PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.
― 6 minilectura
Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.
― 6 minilectura
Explorando los avances en la subtitulación automática de audio y su impacto en la accesibilidad.
― 6 minilectura
La investigación presenta un método efectivo para mejorar la claridad del habla en entornos ruidosos.
― 8 minilectura
Un nuevo método simplifica la transferencia de estilo de audio utilizando efectos no diferenciables.
― 8 minilectura
La investigación examina cómo la música generada por computadora se compara con la interpretación humana a través de pruebas de escucha.
― 9 minilectura
Aprende cómo los polinomios ultrasféricos mejoran la tecnología de audio y la direccionalidad del sonido.
― 7 minilectura
Un nuevo método mejora el reconocimiento de voz usando menos etiquetas y recursos.
― 8 minilectura
Nuevos métodos mejoran la conexión entre descripciones de texto y eventos sonoros.
― 8 minilectura
Métodos innovadores mejoran cómo los robots procesan la dirección del sonido mientras se mueven.
― 7 minilectura
Aprende sobre la formación de haces con valores reales y sus beneficios para arreglos de micrófonos.
― 7 minilectura
MusicAOG simplifica la creación y comprensión de la música a través de una representación gráfica innovadora.
― 7 minilectura
Un nuevo marco para combinar micrófonos y altavoces esféricos en estudios de sonido.
― 7 minilectura
Un nuevo marco para mejorar la detección de sonido en robots humanoides a través del diseño de arreglos de micrófonos.
― 10 minilectura
Descubre cómo los sistemas MIMO mejoran el análisis de sonido en diferentes entornos.
― 8 minilectura
Nuevas técnicas mejoran la estimación de la dirección del sonido para diferentes configuraciones de audio.
― 6 minilectura
La investigación revela métodos para ajustar el comportamiento del sonido en las habitaciones y mejorar la claridad.
― 5 minilectura
Un nuevo modelo identifica momentos graciosos en videos usando datos visuales, de audio y de texto.
― 7 minilectura
Los elastómeros dieléctricos convierten la energía eléctrica en movimiento mecánico, ofreciendo diversas aplicaciones.
― 9 minilectura
Las transcripciones de ASR con errores pueden ayudar a identificar el Alzheimer de manera más precisa.
― 10 minilectura
ELLA-V mejora la calidad y el control del texto a voz, superando modelos anteriores.
― 6 minilectura
Un nuevo enfoque mejora la precisión en la detección de llamadas de animales sin usar umbrales arbitrarios.
― 8 minilectura
Un nuevo modelo integra audio y texto para mejorar la clasificación del habla.
― 8 minilectura
Una nueva iniciativa para mejorar la tecnología de transcripción para reuniones en salas grandes.
― 9 minilectura
Nuevos métodos mejoran la precisión en el reconocimiento de voz ruidosa usando modelos de lenguaje grandes.
― 7 minilectura
Analizar los sonidos de las gallinas ayuda a mejorar su salud y la productividad de la granja.
― 9 minilectura
Un método para ayudar a las personas con discapacidad visual a reconocer sonidos en realidad mixta.
― 6 minilectura
Este artículo habla sobre soluciones para aplicaciones de voz en idiomas con datos transcritos limitados.
― 7 minilectura