Últimos artículos para Reconocimiento de voz

Procesado de Audio y Voz Mejorando Whisper para lenguas de pocos recursos

Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.

2025-09-08T03:55:10+00:00 ― 5 minilectura

Neurociencia Entendiendo el Procesamiento de Voz en Entornos Desafiantes

Este estudio examina cómo la capacidad auditiva afecta la comprensión del habla en entornos ruidosos.

2025-09-07T04:34:28+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando Conjuntos de Datos de Audio con Agrupamiento K-Means

Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.

2025-09-06T15:28:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Selección de Modelo Eficiente para Reconocimiento de Voz

Un método para elegir el mejor modelo de ASR basado en características de audio.

2025-09-05T23:17:15+00:00 ― 6 minilectura

Computación y lenguaje Mi Proyecto de Tutor de Ciencias: Una Nueva Forma de Aprender

MyST busca mejorar el aprendizaje de ciencias de los niños a través de tutorías virtuales.

2025-09-05T09:31:20+00:00 ― 6 minilectura

Sonido Avances en tecnología de transcripción de reuniones

Una mirada a M2MeT 2.0 y su impacto en la transcripción de reuniones.

2025-09-05T03:51:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances y desafíos en los modelos de reconocimiento de voz

Este estudio analiza cómo la compresión de modelos afecta el reconocimiento de voz en entornos ruidosos.

2025-09-04T19:45:25+00:00 ― 6 minilectura

Sonido Avances en modelos de reconocimiento de audio y voz

Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.

2025-09-04T18:08:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de extracción de voz

Presentando nuevos modelos para mejorar la extracción de voz en entornos ruidosos.

2025-09-04T02:45:10+00:00 ― 7 minilectura

Computación y lenguaje Abordando Desafíos en el Reconocimiento Automático de Voz de Larga Duración

La investigación se centra en mejorar los sistemas de ASR para audio no segmentado.

2025-09-03T13:47:50+00:00 ― 6 minilectura

Computación y lenguaje Abordando el sesgo de género en la tecnología de reconocimiento de voz

Examinando las diferencias en el rendimiento del reconocimiento de voz entre géneros.

2025-09-03T12:51:42+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con modelos de lenguaje grandes

Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.

2025-09-03T06:30:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando las transcripciones de reuniones con el sistema PP-MeT

PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.

2025-09-02T04:35:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Un enfoque universal para mejorar el habla

Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.

2025-09-02T02:10:10+00:00 ― 6 minilectura

Computación y lenguaje Avances en el reconocimiento de voz de cambio de código

Este proyecto tiene como objetivo mejorar el reconocimiento del habla mixta de gujarati-inglés.

2025-08-30T05:46:00+00:00 ― 7 minilectura

Computación y lenguaje Avanzando en la clasificación de voz con datos multimodales

Un nuevo modelo integra audio y texto para mejorar la clasificación del habla.

2025-08-29T18:49:00+00:00 ― 8 minilectura

Sonido Reto NOTSOFAR-1: Mejorando la Tecnología de Transcripción de Reuniones

Una nueva iniciativa para mejorar la tecnología de transcripción para reuniones en salas grandes.

2025-08-29T16:23:15+00:00 ― 9 minilectura

Computación y lenguaje Avances en la Corrección de Errores de Reconocimiento de Voz

Nuevos métodos mejoran la precisión en el reconocimiento de voz ruidosa usando modelos de lenguaje grandes.

2025-08-29T01:48:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Abordando los desafíos de la tecnología del habla para idiomas con pocos recursos

Este artículo habla sobre soluciones para aplicaciones de voz en idiomas con datos transcritos limitados.

2025-08-28T18:31:30+00:00 ― 7 minilectura

Computación y lenguaje Documentando Lenguas en Peligro de Extinción con IGT

Un nuevo método apoya la preservación de las lenguas en peligro a través de una documentación detallada.

2025-08-27T17:35:42+00:00 ― 9 minilectura

Procesado de Audio y Voz Nuevo método para eliminar el eco en el habla

Un método mejora la claridad del habla en entornos ruidosos sin datos de entrenamiento claros.

2025-08-26T17:56:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para lenguas de pocos recursos

Nuevos métodos mejoran el ASR para lenguas subrepresentadas usando datos de lenguas similares.

2025-08-26T10:39:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Renacer: Una Nueva Era en ASR No Supervisado

Reborn ofrece soluciones innovadoras para el reconocimiento automático de voz sin datos etiquetados.

2025-08-25T19:16:10+00:00 ― 7 minilectura

Computación y lenguaje Avances en la Tecnología de Diálogo Hablado

Una mirada a nuevos modelos para respuestas habladas naturales.

2025-08-25T03:04:30+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando la diarización de hablantes con enfoques de múltiples micrófonos

Nuevos métodos mejoran la detección de actividad de voz y superposición en la diarización del hablante.

2025-08-24T13:18:35+00:00 ― 8 minilectura

Procesado de señales Chirp MFCC: Un Nuevo Enfoque en el Procesamiento de Audio

Chirp MFCC mejora la representación de la señal de audio para una mejor clasificación y reconocimiento.

2025-08-23T08:58:10+00:00 ― 6 minilectura

Computación y lenguaje Proyecto Kallaama: Uniendo el lenguaje y la tecnología en la agricultura

Kallaama crea un conjunto de datos de habla en idiomas locales para ayudar a los agricultores senegaleses.

2025-08-23T02:43:54+00:00 ― 5 minilectura

Computación y lenguaje Avanzando Modelos de Lenguaje a Través de Estilos de Habla

Un nuevo marco mejora los modelos de lenguaje al reconocer y responder a diferentes estilos de habla.

2025-08-23T00:03:45+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando la Verificación de Voz para Niños

Mejorando los sistemas de ASV para reconocer las voces de los niños con precisión.

2025-08-22T09:29:15+00:00 ― 11 minilectura

Procesado de Audio y Voz Avances en la Estimación de las Propiedades Acústicas de las Habitaciones

La investigación destaca nuevos modelos para mejorar la calidad de audio en diferentes entornos.

2025-08-22T03:00:35+00:00 ― 9 minilectura

Sonido Avances en técnicas de diarización automática de hablantes

La investigación destaca la importancia del tiempo sobre las características específicas del hablante en los modelos de diarización.

2025-08-21T00:17:20+00:00 ― 7 minilectura

Interacción Persona-Ordenador Avances en Interfaces de Habla Silenciosa

Una mirada a MONA, un sistema que mejora la comunicación en silencio.

2025-08-20T16:11:30+00:00 ― 5 minilectura

Robótica Mejorando el reconocimiento de voz de los robots en entornos ruidosos

La investigación se centra en ayudar a los robots a entender mejor el habla en medio del ruido de fondo.

2025-08-19T22:22:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Evaluando el Reconocimiento de Voz en Entornos Ruidosos

Un nuevo estándar evalúa el rendimiento de los sistemas de reconocimiento de voz en medio de diversas interferencias.

2025-08-19T14:16:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en implantes cocleares con tecnologías de IA

La IA está mejorando los implantes cocleares para tener mejor audición y comunicación en entornos difíciles.

2025-08-17T13:41:50+00:00 ― 8 minilectura

Sonido Nuevo enfoque para la separación de audio usando lenguaje

Este método mejora la separación de audio al combinar descripciones de lenguaje con análisis de sonido.

2025-08-13T14:57:35+00:00 ― 7 minilectura

Sonido Análisis de voz innovador para la detección temprana del Parkinson

La investigación muestra que usar análisis de voz para identificar la enfermedad de Parkinson temprano tiene potencial.

2025-08-09T16:24:42+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en la Comprensión del Lenguaje Hablado con CCL

Un nuevo método mejora cómo los sistemas manejan errores en la comprensión del lenguaje hablado.

2025-08-08T14:20:30+00:00 ― 8 minilectura

Computación y lenguaje Decodificación por fusión generativa: Avanzando en el reconocimiento de texto

Un nuevo método mejora la precisión del reconocimiento de texto en varias aplicaciones.

2025-08-07T22:00:54+00:00 ― 7 minilectura

Computación y lenguaje Nuevo método de ataque silencia sistemas ASR

Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.

2025-08-07T03:29:35+00:00 ― 7 minilectura