Últimos artículos para Reconocimiento de voz

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de voz sensible al dominio

Nuevos métodos mejoran el reconocimiento de voz en campos específicos sin necesidad de mucha data.

2025-10-07T15:37:00+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Embeddings Acústicos de Palabras

Un nuevo modelo mejora la forma en que las computadoras procesan el lenguaje hablado.

2025-10-07T04:16:50+00:00 ― 5 minilectura

Computación y lenguaje Avances en tecnología de reconocimiento de voz

El transductor de riesgo de Bayes mejora la eficiencia y precisión del reconocimiento de voz.

2025-10-06T21:31:36+00:00 ― 6 minilectura

Computación y lenguaje Avances en la respuesta a preguntas habladas con LibriSQA

Nuevo conjunto de datos y marco mejoran las capacidades de respuesta a preguntas orales.

2025-10-06T17:42:30+00:00 ― 5 minilectura

Sonido Nuevo marco mejora el reconocimiento de voz con metadatos

Integrar metadatos mejora el rendimiento en tareas de habla como la identificación de idiomas.

2025-10-06T12:05:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Modelos de Transductores para el Reconocimiento de Voz

Este artículo habla sobre las capacidades en tiempo real del modelo Transductor y las mejoras recientes.

2025-10-06T11:16:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la Identificación de Temas a partir de Datos de Audio

La investigación explora métodos para identificar temas directamente de grabaciones de audio.

2025-10-05T23:56:25+00:00 ― 6 minilectura

Sonido Avanzando en la Tecnología del Habla con SCRAPS

Un nuevo modelo conecta la fonética y la acústica para mejorar la tecnología del habla.

2025-10-05T13:24:50+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la Detección de Altavoces Activos Usando Audio

Las investigaciones muestran que tener varios micrófonos ayuda a detectar y localizar a los hablantes.

2025-10-03T11:12:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Mejora de Voz con PCNN

Presentamos un nuevo modelo para hablar más claro en ambientes ruidosos.

2025-10-03T07:58:20+00:00 ― 6 minilectura

Sonido Avances en Diarización de Hablar a Través de la Integración Audio-Visual

Nuevos sistemas mejoran la identificación de hablantes usando datos de audio y visuales.

2025-10-02T15:46:40+00:00 ― 5 minilectura

Computación y lenguaje Avances en la tecnología de entrenamiento de pronunciación

Los investigadores están mejorando el entrenamiento de pronunciación con nuevas tecnologías para los que aprenden idiomas.

2025-10-02T07:40:50+00:00 ― 6 minilectura

Recuperación de información Avances en la Tecnología de Búsqueda por Voz

La tecnología de búsqueda por voz evoluciona, corrigiendo errores de ASR para mejorar la experiencia del usuario.

2025-09-30T17:00:24+00:00 ― 7 minilectura

Sonido Avances en la detección de audio falso con RAWM

Un nuevo método mejora la detección de audio falso usando modificación adaptativa de pesos.

2025-09-29T01:08:15+00:00 ― 7 minilectura

Sonido Avances en el reconocimiento de voz del hablante objetivo

Nuevo modelo mejora el reconocimiento de voz en entornos ruidosos al centrarse en un solo hablante.

2025-09-28T08:08:00+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando en el Reconocimiento de Voz Bilingüe con Unidades de Grafemas

Mejorando sistemas ASR híbridos para habla bilingüe usando unidades de grafemas.

2025-09-27T03:47:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Aprendizaje Conjunto de Habla y Texto

Un nuevo modelo mejora la alineación de voz y texto para un mejor reconocimiento automático.

2025-09-27T02:10:25+00:00 ― 7 minilectura

Computación y lenguaje Nuevos Métodos para Evaluar la Diarización de Habla

Presentando nuevas métricas para evaluar la precisión de la diarización de hablantes en la IA conversacional.

2025-09-26T18:04:30+00:00 ― 7 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz

Nuevos métodos mejoran la precisión y la velocidad en los sistemas de reconocimiento de voz.

2025-09-26T11:35:55+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento Automático de Voz con Inyección de Texto

Un nuevo método mejora el rendimiento del ASR a través de la integración de datos de texto.

2025-09-26T07:33:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con inyección de texto

La inyección de texto ayuda a reconocer información personal mientras se mantiene la privacidad.

2025-09-26T06:44:25+00:00 ― 6 minilectura

Sonido Avances en el Reconocimiento de Voz con Tecnología mmWave

Radio2Text usa señales mmWave para el reconocimiento de voz en tiempo real en entornos ruidosos.

2025-09-25T22:38:35+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la conversión de grafema a fonema con un nuevo método de muestreo

Este estudio mejora los modelos G2P al centrarse en las áreas propensas a errores durante el entrenamiento.

2025-09-25T05:38:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en técnicas de seguimiento de formantes

Descubre métodos que mejoran la precisión en el seguimiento de formantes para el análisis del habla.

2025-09-24T22:21:05+00:00 ― 8 minilectura

Computación y lenguaje Avances en el modelado de lenguaje hablado

Nuevos métodos mejoran el procesamiento y la generación de habla en los modelos de lenguaje.

2025-09-19T16:02:05+00:00 ― 6 minilectura

Sonido Avances en la Tecnología de Supresión de Ruido

Nuevas técnicas mejoran la claridad del audio en entornos ruidosos.

2025-09-19T15:13:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la detección de palabras clave con pocos ejemplos usando datos de habla leída

Nuevos métodos mejoran la detección de palabras clave usando datos de habla leída disponibles.

2025-09-19T13:36:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando en la estimación de confianza en el reconocimiento automático de voz

Un nuevo enfoque mejora la estimación de confianza en los sistemas de ASR para más precisión.

2025-09-15T03:14:28+00:00 ― 5 minilectura

Aprendizaje automático Desafíos en el uso de Convnets para el diseño de filtros de audio

Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.

2025-09-14T14:34:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la diarización de hablantes con modelos de lenguaje

Este artículo explora los avances en la diarización de hablantes usando modelos de lenguaje para mejorar la precisión.

2025-09-14T03:14:25+00:00 ― 6 minilectura

Procesado de Audio y Voz PromptASR: Tecnología de Reconocimiento de Voz de Siguiente Nivel

Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.

2025-09-13T10:14:10+00:00 ― 5 minilectura

Sonido Avances en Modelos de Audio Universal

EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.

2025-09-13T09:25:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Un Nuevo Enfoque para Detectar Palabras Clave

Presentamos un método flexible para reconocer palabras clave en el habla en diferentes idiomas.

2025-09-13T06:11:15+00:00 ― 7 minilectura

Sonido Nuevo sistema mejora la extracción de voz desde posiciones inestables de la cabeza

PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.

2025-09-12T19:39:40+00:00 ― 7 minilectura

Sonido Un Nuevo Marco para la Anonimización de Voces

Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.

2025-09-12T05:05:10+00:00 ― 8 minilectura

Computación y lenguaje Mejorando las explicaciones para modelos de voz

Un nuevo método simplifica la comprensión de los modelos de clasificación de voz.

2025-09-12T02:39:25+00:00 ― 7 minilectura

Sonido M-AUDIODEC: Una nueva forma de comprimir audio

M-AUDIODEC comprime audio multicanal manteniendo la posición de los altavoces y la calidad.

2025-09-11T16:56:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Calidad de Sonido en Audífonos

La investigación revela nuevos modelos para mejorar la claridad del sonido en los auriculares inteligentes.

2025-09-11T12:04:55+00:00 ― 6 minilectura

Inteligencia artificial Mejorando la comprensión de los robots sobre las instrucciones humanas

Un nuevo método mejora la capacidad de los robots para seguir instrucciones habladas con precisión.

2025-09-11T08:21:18+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en las técnicas de detección de discursos falsos

Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.

2025-09-11T02:21:55+00:00 ― 6 minilectura