Últimos artículos para Reconocimiento de voz

Procesado de Audio y Voz Avances en el seguimiento de formantes para el procesamiento del habla

Nuevos métodos de un solo paso mejoran la precisión en el seguimiento de formantes para los sonidos del habla.

2025-09-19T02:16:10+00:00 ― 5 minilectura

Computación y lenguaje Conectando el habla con modelos de lenguaje: El método BLSP

Un nuevo enfoque mejora la integración del habla con los modelos de lenguaje.

2025-09-18T15:44:35+00:00 ― 8 minilectura

Procesado de Audio y Voz VoxtLM: Un enfoque unificado para voz y texto

VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.

2025-09-13T11:02:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Libriheavy: Un Nuevo Conjunto de Datos para el Reconocimiento de Voz

Libriheavy ofrece 50,000 horas de inglés hablado para mejorar la tecnología de reconocimiento de voz.

2025-09-12T18:51:05+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Voz con Prompts Suaves

Los soft prompts mejoran la tecnología de reconocimiento de voz para un mejor rendimiento en ambientes ruidosos.

2025-09-10T04:30:10+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el Reconocimiento de Voz: Sistemas que Siguen Instrucciones

Un nuevo enfoque para el reconocimiento de voz mejora la interacción del usuario con instrucciones flexibles.

2025-09-09T08:15:35+00:00 ― 5 minilectura

Sonido Mejorando el Reconocimiento de Voz con Entrenamiento en Tiempo de Prueba

Explora cómo TTT mejora el reconocimiento de voz al adaptarse a cambios en la distribución.

2025-09-08T14:26:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con técnicas de dereverberación

Aprende cómo la dereverberación mejora el reconocimiento de voz en ambientes ruidosos.

2025-09-05T12:45:40+00:00 ― 5 minilectura

Sonido Avances en modelos de reconocimiento de audio y voz

Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.

2025-09-04T18:08:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para acentos diversos

Mejorando los modelos de voz para reconocer y adaptarse mejor a diferentes acentos.

2025-09-04T08:25:15+00:00 ― 5 minilectura

Computación y lenguaje Construyendo reconocimiento de voz para lenguas indias

Un proyecto para mejorar el reconocimiento de voz en diferentes idiomas indios.

2025-09-01T15:10:24+00:00 ― 5 minilectura

Computación y lenguaje Proyecto Kallaama: Uniendo el lenguaje y la tecnología en la agricultura

Kallaama crea un conjunto de datos de habla en idiomas locales para ayudar a los agricultores senegaleses.

2025-08-23T02:43:54+00:00 ― 5 minilectura

Computación y lenguaje Desafíos y Oportunidades para las Lenguas Indígenas en el PLN

Las lenguas indígenas enfrentan desafíos en la tecnología mientras ofrecen ricas perspectivas culturales.

2025-08-21T07:40:36+00:00 ― 7 minilectura

Robótica Evaluando un Robot Social en el Cuidado de la Salud

Un estudio sobre el uso de ARI en una residencia de día gerontológica.

2025-08-20T09:17:36+00:00 ― 7 minilectura

Computación y lenguaje Clasificando subdialectos del kurdo sorani a través de datos de audio

La investigación identifica y clasifica los dialectos kurdos sorani usando grabaciones de audio extensas.

2025-08-14T07:57:50+00:00 ― 7 minilectura

Computación y lenguaje Decodificación por fusión generativa: Avanzando en el reconocimiento de texto

Un nuevo método mejora la precisión del reconocimiento de texto en varias aplicaciones.

2025-08-07T22:00:54+00:00 ― 7 minilectura

Interacción Persona-Ordenador Avanzando en la Comunicación de Robots: Solución para el Hablar Simultáneo

Un nuevo sistema mejora las interacciones de los robots al filtrar el habla superpuesta.

2025-08-04T13:57:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento Automático de Voz con TTA Dinámico

Nuevos métodos mejoran el reconocimiento de voz en entornos ruidosos usando técnicas adaptativas.

2025-07-29T13:49:25+00:00 ― 8 minilectura

Computación y lenguaje Avances en la traducción de discurso con cambio de código

Un nuevo método mejora la traducción de habla en varios idiomas al inglés.

2025-07-29T09:46:30+00:00 ― 6 minilectura

Procesado de Audio y Voz GigaSpeech 2: Un Nuevo Conjunto de Datos para el Reconocimiento de Voz

GigaSpeech 2 ofrece un montón de datos para lenguas de pocos recursos para mejorar el reconocimiento de voz.

2025-07-29T02:29:15+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones El Conjunto de Datos BabyView: Una Nueva Mirada al Aprendizaje Infantil

Un conjunto de datos único captura la vida diaria de los niños para mejorar el aprendizaje automático y la comprensión del aprendizaje humano.

2025-07-29T01:16:42+00:00 ― 9 minilectura

Computación y lenguaje Sistemas de IA Generativa: Dando Forma al Futuro de la Creación de Contenido

Descubre cómo la IA Generativa está cambiando la forma en que creamos contenido.

2025-07-24T05:01:00+00:00 ― 7 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz automático

Nuevos métodos mejoran la precisión y eficiencia en los sistemas de reconocimiento de voz.

2025-07-22T03:41:05+00:00 ― 8 minilectura

Sonido Avanzando en la comunicación: el reconocimiento de voz se encuentra con el código Morse

Un nuevo modelo mejora la comunicación para personas con discapacidades usando reconocimiento de voz y código Morse.

2025-07-18T02:52:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Qwen2-Audio: Una Nueva Voz para la Tecnología

Un modelo impulsado por voz que transforma la interacción de audio con la tecnología.

2025-07-16T00:18:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Vibravox: Avanzando en la Tecnología de Reconocimiento de Voz

Un nuevo conjunto de datos busca mejorar la captura de voz usando sensores de conducción por el cuerpo.

2025-07-15T14:35:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para el idioma polaco

La investigación presenta nuevos métodos para evaluar sistemas de reconocimiento de voz en polaco.

2025-07-14T16:44:10+00:00 ― 7 minilectura

Neuronas y cognición Avances en la tecnología de EEG para la recuperación del habla

Investigadores mejoran la decodificación del habla usando EEG para ayudar a quienes tienen dificultades para hablar.

2025-07-12T16:20:33+00:00 ― 8 minilectura

Computación y lenguaje Evaluando el reconocimiento de voz en historias orales multilingües

Este estudio evalúa sistemas de reconocimiento de voz usando diferentes idiomas para la historia oral.

2025-07-07T12:29:12+00:00 ― 6 minilectura

Interacción Persona-Ordenador OpenOmni: Avanzando Agentes de Conversación Multimodales

OpenOmni crea herramientas flexibles para hacer y probar agentes de conversación.

2025-07-01T09:40:42+00:00 ― 9 minilectura

Computación y lenguaje Mejorando las técnicas de resumido de voz cruzado

La investigación se centra en mejorar la resumición de conversaciones habladas entre diferentes idiomas.

2025-06-29T05:24:24+00:00 ― 7 minilectura

Sonido Presentamos NEST: Un Nuevo Modelo para el Procesamiento del Habla

NEST ofrece un enfoque más rápido y eficiente para tareas de habla auto-supervisadas.

2025-06-25T20:06:05+00:00 ― 7 minilectura

Inteligencia artificial Mejorando el Reconocimiento de Voz a Través de la Predicción de Errores

La investigación se centra en predecir errores en el reconocimiento de voz para lograr mejor precisión.

2025-06-25T10:09:42+00:00 ― 6 minilectura

Computación y lenguaje Nuevo estándar para el reconocimiento de voz en hindi

La investigación mejora el reconocimiento de voz para el hindi con acentos diversos.

2025-06-24T05:11:42+00:00 ― 5 minilectura

Sonido Avances en la Verificación de Voces Usando Whisper

Un nuevo método mejora la precisión del reconocimiento de voz en varios idiomas.

2025-06-22T18:25:00+00:00 ― 6 minilectura

Sonido Nuevo conjunto de datos mejora la tecnología de reconocimiento de voz

Los investigadores crean LibriheavyMix para mejorar el reconocimiento de voz en entornos ruidosos.

2025-06-20T22:41:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Evaluando el modelo Mamba en tareas de procesamiento de voz

Esta investigación analiza el rendimiento de Mamba en tareas de habla, enfatizando la reconstrucción y el reconocimiento de sonidos.

2025-06-14T23:22:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Hitos Acústicos: Un Nuevo Conjunto de Datos para el Procesamiento del Habla

Los investigadores desarrollan un conjunto de datos para mejorar las técnicas de reconocimiento y análisis de voz.

2025-06-13T19:50:25+00:00 ― 7 minilectura

Computación y lenguaje Avanzando el Reconocimiento de Habla para el Idioma Faetar

Esfuerzos para mejorar la tecnología de voz para el idioma Faetar, que tiene pocos recursos.

2025-06-13T09:18:50+00:00 ― 6 minilectura

Computación y lenguaje Mejorando la Precisión del Reconocimiento de Voz con Modelos de Lenguaje

Un estudio sobre el uso de modelos de lenguaje para corregir errores en sistemas de reconocimiento de voz.

2025-06-12T22:47:15+00:00 ― 7 minilectura