Un modelo de código abierto dedicado a corregir errores gramaticales en chino nativo.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un modelo de código abierto dedicado a corregir errores gramaticales en chino nativo.
― 6 minilectura
Un nuevo referente para evaluar modelos de lenguaje en contextos médicos en chino.
― 12 minilectura
Un nuevo modelo mejora la forma en que las computadoras procesan el lenguaje hablado.
― 5 minilectura
Una mirada a los recomendadores conversacionales usando diálogos reales para mejores sugerencias.
― 7 minilectura
El nuevo modelo EmoPP mejora el habla con señales emocionales.
― 6 minilectura
AceGPT mejora el procesamiento del lenguaje árabe adaptado a la cultura y valores locales.
― 6 minilectura
PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.
― 7 minilectura
FluentEditor mejora la edición de audio al centrarse en el flujo natural y la consistencia.
― 5 minilectura
Nuevos métodos de aprendizaje mejoran la eficiencia y precisión de las redes neuronales tipo spiking.
― 8 minilectura
CoAVT integra datos de audio, visuales y de texto para una mejor comprensión.
― 9 minilectura
Nuevos métodos mejoran la detección de altavoces audio-visuales en entornos complicados.
― 8 minilectura
SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.
― 8 minilectura
AdvEval expone las debilidades en las métricas de evaluación de Generación de Lenguaje Natural.
― 8 minilectura
Un nuevo enfoque mejora los sistemas de diálogo al combinar estructuras de tema y retóricas.
― 8 minilectura
El nuevo modelo ARDiT mejora la síntesis de texto a voz y la edición de audio.
― 7 minilectura
Una mirada a nuevos métodos para entender el habla entrecortada durante las conversaciones.
― 9 minilectura
Un nuevo método mejora la conversión de voz entre idiomas mientras conserva las características del hablante.
― 5 minilectura
Una revisión de cómo la selección de datos mejora el rendimiento de los modelos de lenguaje.
― 6 minilectura
Un nuevo marco mejora la conexión entre caras y voces, especialmente en entornos ruidosos.
― 6 minilectura
Un nuevo método mejora la precisión de la localización sonora y asegura la privacidad de los datos.
― 5 minilectura
Un nuevo método para generar habla acentuada usando transliteración de texto.
― 7 minilectura
E1 TTS transforma texto en habla natural más rápido y de manera más eficiente.
― 6 minilectura
Descubre cómo los embeddings Matryoshka mejoran la eficiencia y flexibilidad del reconocimiento de hablantes.
― 6 minilectura
Presentamos un nuevo modelo y benchmark para evaluar tareas de audio múltiple.
― 7 minilectura
Nuevo método mejora la claridad del habla usando información visual del entorno.
― 6 minilectura
Descubre cómo la TTS emocional cambia la comunicación con las máquinas, haciéndolas más cercanas.
― 7 minilectura