Haizhou Li

Computación y lenguaje GrammarGPT: Avanzando en la corrección de errores gramaticales en chino

Un modelo de código abierto dedicado a corregir errores gramaticales en chino nativo.

2025-10-16T03:38:54+00:00 ― 6 minilectura

Computación y lenguaje Presentamos el Referente Médico Integral para LLMs en China

Un nuevo referente para evaluar modelos de lenguaje en contextos médicos en chino.

2025-10-07T18:51:24+00:00 ― 12 minilectura

Procesado de Audio y Voz Avances en Embeddings Acústicos de Palabras

Un nuevo modelo mejora la forma en que las computadoras procesan el lenguaje hablado.

2025-10-07T04:16:50+00:00 ― 5 minilectura

Computación y lenguaje Aprovechando Sistemas de Recomendación Conversacionales Holísticos

Una mirada a los recomendadores conversacionales usando diálogos reales para mejores sugerencias.

2025-09-26T18:12:24+00:00 ― 7 minilectura

Inteligencia artificial Avances en la tecnología de texto a voz que entiende emociones

El nuevo modelo EmoPP mejora el habla con señales emocionales.

2025-09-24T07:13:12+00:00 ― 6 minilectura

Computación y lenguaje AceGPT: Uniendo Lenguaje y Cultura para Hablantes de Árabe

AceGPT mejora el procesamiento del lenguaje árabe adaptado a la cultura y valores locales.

2025-09-23T18:42:42+00:00 ― 6 minilectura

Sonido Nuevo sistema mejora la extracción de voz desde posiciones inestables de la cabeza

PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.

2025-09-12T19:39:40+00:00 ― 7 minilectura

Sonido Avances en la edición de voz basada en texto

FluentEditor mejora la edición de audio al centrarse en el flujo natural y la consistencia.

2025-09-07T20:37:55+00:00 ― 5 minilectura

Computación Neuronal y Evolutiva Avances en el entrenamiento de Redes Neuronales de Pulsos

Nuevos métodos de aprendizaje mejoran la eficiencia y precisión de las redes neuronales tipo spiking.

2025-09-03T02:03:54+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Procesamiento Multimodal con CoAVT

CoAVT integra datos de audio, visuales y de texto para una mejor comprensión.

2025-08-28T12:02:50+00:00 ― 9 minilectura

Procesado de Audio y Voz Avanzando la tecnología de detección de hablantes activos

Nuevos métodos mejoran la detección de altavoces audio-visuales en entornos complicados.

2025-08-14T01:29:10+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando en la extracción de hablantes objetivo de audio y video con SEANet

SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.

2025-08-08T20:47:20+00:00 ― 8 minilectura

Computación y lenguaje Evaluando la NLG con el marco AdvEval

AdvEval expone las debilidades en las métricas de evaluación de Generación de Lenguaje Natural.

2025-08-08T07:29:42+00:00 ― 8 minilectura

Computación y lenguaje Mejorando los Sistemas de Diálogo a Través del Aprendizaje Mutuo

Un nuevo enfoque mejora los sistemas de diálogo al combinar estructuras de tema y retóricas.

2025-08-04T06:19:30+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la síntesis de voz con ARDiT

El nuevo modelo ARDiT mejora la síntesis de texto a voz y la edición de audio.

2025-07-31T07:55:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de diarización de habla objetivo

Una mirada a nuevos métodos para entender el habla entrecortada durante las conversaciones.

2025-07-30T14:06:55+00:00 ― 9 minilectura

Procesado de Audio y Voz Avances en la Conversión de Voz Multilingüe

Un nuevo método mejora la conversión de voz entre idiomas mientras conserva las características del hablante.

2025-07-27T15:40:10+00:00 ― 5 minilectura

Computación y lenguaje La importancia de la selección de datos en los modelos de lenguaje

Una revisión de cómo la selección de datos mejora el rendimiento de los modelos de lenguaje.

2025-07-26T03:06:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la tecnología de reconocimiento facial y de voz

Un nuevo marco mejora la conexión entre caras y voces, especialmente en entornos ruidosos.

2025-07-10T17:11:20+00:00 ― 6 minilectura

Sonido Avances en Localización de Fuentes Sonoras con Aprendizaje Incremental

Un nuevo método mejora la precisión de la localización sonora y asegura la privacidad de los datos.

2025-06-14T07:59:10+00:00 ― 5 minilectura

Sonido Avances en técnicas de conversión de acentos

Un nuevo método para generar habla acentuada usando transliteración de texto.

2025-06-11T06:18:05+00:00 ― 7 minilectura

Procesado de Audio y Voz E1 TTS: Una Nueva Era en Tecnología de Texto a Voz

E1 TTS transforma texto en habla natural más rápido y de manera más eficiente.

2025-06-11T05:29:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Embeddings de altavoces Matryoshka: Un enfoque flexible para el reconocimiento de voz

Descubre cómo los embeddings Matryoshka mejoran la eficiencia y flexibilidad del reconocimiento de hablantes.

2025-06-02T20:40:50+00:00 ― 6 minilectura

Sonido Avanzando en el procesamiento multi-audio con MALLM

Presentamos un nuevo modelo y benchmark para evaluar tareas de audio múltiple.

2025-05-31T19:17:15+00:00 ― 7 minilectura

Sonido Usando pistas visuales para aclarar el habla en ruido

Nuevo método mejora la claridad del habla usando información visual del entorno.

2025-05-18T20:42:14+00:00 ― 6 minilectura

Sonido Trayendo emoción a las máquinas: El futuro del TTS

Descubre cómo la TTS emocional cambia la comunicación con las máquinas, haciéndolas más cercanas.

2025-02-23T02:25:48+00:00 ― 7 minilectura