Prak simplifica la alineación fonética para la investigación en lengua checa.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Prak simplifica la alineación fonética para la investigación en lengua checa.
― 5 minilectura
Un conjunto de datos de audio completo busca mejorar los métodos de dereverberación para un sonido más claro.
― 7 minilectura
Nuevas técnicas mejoran la precisión en el reconocimiento de voz en tiempo real y fuera de línea.
― 6 minilectura
CB-Conformer mejora el reconocimiento de voz para palabras sesgadas con técnicas innovadoras.
― 6 minilectura
Un nuevo método mejora las defensas contra ataques adversarios de audio en sistemas de reconocimiento de voz.
― 7 minilectura
Un nuevo método mejora el análisis de datos funcionales complejos.
― 9 minilectura
Un nuevo modelo combina datos de audio y texto para mejorar la precisión del reconocimiento de voz.
― 6 minilectura
Un nuevo enfoque usa tecnología deepfake para identificar énfasis en el lenguaje hablado.
― 6 minilectura
Un nuevo método mejora la comprensión del habla por parte de las máquinas usando datos de audio sin etiquetar.
― 6 minilectura
SpeechGPT conecta el habla y el texto para interacciones avanzadas de IA.
― 5 minilectura
Un nuevo método mejora los sistemas de detección de palabras clave en condiciones de pocos recursos.
― 6 minilectura
Un nuevo modelo mejora la comprensión de diálogos hablados al combinar el habla y el texto.
― 7 minilectura
Los modelos de lenguaje basados en energía muestran potencial para mejorar la precisión del reconocimiento de voz.
― 6 minilectura
Este artículo habla sobre cómo mejorar las predicciones adaptando datos de diferentes dominios.
― 6 minilectura
Un nuevo enfoque mejora la comprensión del lenguaje hablado usando procesamiento de audio eficiente.
― 8 minilectura
Este estudio analiza el rendimiento de los LLMs en tareas de NLP y de habla en árabe.
― 5 minilectura
AudioSlots mejora la claridad del sonido al separar las grabaciones de audio mezcladas de manera efectiva.
― 5 minilectura
Nuevo método mejora modelos de reconocimiento de voz y reduce la pérdida de conocimiento.
― 5 minilectura
Aprende cómo el filtrado bayesiano ayuda a afinar la comprensión en sistemas inciertos.
― 8 minilectura
Explorando métodos para mejorar la adaptación de modelos de lenguaje en sistemas de reconocimiento de voz.
― 6 minilectura
Este estudio adapta el modelo Whisper para detectar vocalizaciones entre especies.
― 6 minilectura
Un nuevo enfoque no supervisado mejora la isolación de voces en mezclas de audio.
― 5 minilectura
Un nuevo estándar para evaluar modelos de aprendizaje automático en la comprensión del habla entre idiomas.
― 7 minilectura
Este artículo habla sobre métodos para mejorar la clasificación de teléfonos usando características de audio.
― 8 minilectura
Un nuevo método asegura la privacidad en la clasificación de voz sin sacrificar el rendimiento.
― 7 minilectura
La investigación examina la comprensión de la sintaxis en modelos de lenguaje hablado usando varios métodos.
― 7 minilectura
Este estudio se centra en reconocer dialectos árabes usando métodos avanzados y datos limitados.
― 5 minilectura
Este estudio examina formas de mejorar el ASR para lenguas de pocos recursos utilizando técnicas de datos.
― 5 minilectura
Un nuevo método mejora la detección de palabras clave en grabaciones de audio.
― 7 minilectura
Un nuevo método mejora los modelos de voz y reduce las necesidades de recursos.
― 7 minilectura
Nuevos métodos que usan el habla muestran promesas para identificar patrones de respiración y condiciones de salud.
― 6 minilectura
Nuevos métodos mejoran la eficiencia en los sistemas de reconocimiento de voz sin perder precisión.
― 7 minilectura
Nuevo modelo mejora el reconocimiento de palabras clave en entornos acústicos desafiantes.
― 7 minilectura
OTW ofrece una alternativa más rápida que DTW para comparar datos de series temporales.
― 6 minilectura
Una mirada detallada a las técnicas de reconocimiento de hablantes desarrolladas para la competencia de 2022.
― 6 minilectura
Mejorando el reconocimiento de idiomas con modelos más pequeños y rápidos para aplicaciones del mundo real.
― 6 minilectura
Explorando cómo ciwGAN puede aprender y representar características fonológicas como la nasalidad.
― 5 minilectura
Los investigadores usan GANs para generar audio ruidoso a partir de audio limpio, mejorando los modelos de voz.
― 7 minilectura
Usando modelos de texto para mejorar la generación de voz y así entender mejor.
― 9 minilectura
La investigación muestra cómo el texto sintético puede mejorar efectivamente los sistemas de ASR.
― 6 minilectura