Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.
― 7 minilectura
Un nuevo conjunto de datos potencia la atención médica con sistemas de preguntas basados en voz para imágenes médicas.
― 8 minilectura
Un estudio sobre cómo mejorar la precisión de la transcripción a través de un mejor diseño de prompts.
― 6 minilectura
Un nuevo enfoque mejora los sistemas SER al usar descripciones de ambientes ruidosos.
― 7 minilectura
Combinar TTS y datos reales mejora efectivamente los sistemas de reconocimiento de voz.
― 5 minilectura
Nuevo método mejora la conversión de el habla silenciosa a audio comprensible.
― 6 minilectura
Un nuevo método mejora la separación de voces en entornos ruidosos con múltiples hablantes.
― 6 minilectura
Este estudio presenta un método para evaluar el significado de las señales sonoras.
― 7 minilectura
Nuevos métodos buscan mejorar el reconocimiento del habla susurrada en sistemas automáticos.
― 7 minilectura
Los modelos de IA mejoran la precisión de las conversiones de voz a texto.
― 6 minilectura
Examinando técnicas para proteger la privacidad mientras se analizan conversaciones grabadas.
― 6 minilectura
Un nuevo modelo integra datos de audio y visuales para el reconocimiento y la traducción del habla.
― 7 minilectura
Nuevos métodos mejoran la precisión del reconocimiento de voz para acentos diversos.
― 5 minilectura
Wav2graph crea grafos de conocimiento a partir del lenguaje hablado para mejorar la comprensión de la IA.
― 8 minilectura
MulliVC transforma voces entre idiomas con una precisión y claridad impresionantes.
― 6 minilectura
Nuevo sistema de navegación para robots entiende órdenes habladas a través de emociones.
― 7 minilectura
El modelo TOGGL mejora la precisión de la transcripción en situaciones de habla superpuesta.
― 6 minilectura
Un método para mejorar la calidad del reconocimiento de voz en entornos ruidosos.
― 8 minilectura
Los investigadores desarrollan SaSLaW para mejorar la adaptación del habla de las máquinas en diferentes entornos.
― 6 minilectura
Un nuevo conjunto de datos resalta los sesgos en los modelos de lenguaje según el género y la edad.
― 9 minilectura
La investigación revela cómo hacer que los modelos de voz sean más pequeños y eficientes.
― 6 minilectura
El entrenamiento adversarial mejora la precisión del reconocimiento de palabras clave en habla sintética y real.
― 6 minilectura
Un nuevo estándar mejora la evaluación de los sistemas de reconocimiento de emociones en el habla a través de distintos idiomas y emociones.
― 7 minilectura
Nuevos métodos mejoran los modelos de ASR para múltiples idiomas, preservando el conocimiento pasado.
― 6 minilectura
Un nuevo enfoque mejora el reconocimiento de frases en código mezclado en el habla bilingüe.
― 6 minilectura
Un nuevo método para manejar mejor las secuencias de datos largas.
― 5 minilectura
Examinando cómo los patrones de voz afectan el significado y el rendimiento tecnológico.
― 6 minilectura
Una mirada a las complejidades de identificar pistas de audio mezcladas.
― 7 minilectura
O-HuBERT mejora el reconocimiento de voz al separar la información del contenido y la información expresiva.
― 7 minilectura
Un nuevo método mejora el reconocimiento de voz para Hindi usando técnicas de pseudoetiquetado.
― 5 minilectura
Un sistema para clasificar los dialectos literarios y coloquiales del tamil usando características de sonido.
― 6 minilectura
Nuevos métodos mejoran la comprensión de la computadora sobre el habla susurrada y normal.
― 6 minilectura
Una mirada a la recorte de micro-lotes y sus beneficios para el entrenamiento de modelos.
― 6 minilectura
La investigación muestra cómo los LLMs mejoran el reconocimiento automático de voz en japonés.
― 7 minilectura
Este artículo examina cómo los modelos reconocen el tono, el estrés y los acentos de pitch.
― 6 minilectura
SALSA mejora la precisión del reconocimiento de voz para lenguas de pocos recursos al integrar ASR y modelos de lenguaje.
― 6 minilectura
Nuevo método mejora la precisión de ASR usando modelos de lenguaje para mejores transcripciones.
― 4 minilectura
Un nuevo sistema corrige errores de identificación de hablantes para tener transcripciones de conversación más claras.
― 9 minilectura
Mejorando la claridad del habla a través de filtros híbridos y redes neuronales.
― 6 minilectura
Un nuevo modelo mejora el reconocimiento de voz al combinar de manera efectiva las entradas de audio y visuales.
― 6 minilectura