Shinji Watanabe

Procesado de Audio y Voz VoxtLM: Un enfoque unificado para voz y texto

VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.

2025-09-13T11:02:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Computación y lenguaje Avances en la Traducción Simultánea de Habla

Mejorando las traducciones en tiempo real a través de métodos innovadores y políticas inteligentes.

2025-09-07T17:23:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Nuevas Técnicas

Una mirada a los avances en el reconocimiento de voz para aumentar la velocidad y la precisión.

2025-09-03T21:05:05+00:00 ― 6 minilectura

Computación y lenguaje Avances en la traducción de voz a través del contexto

Nuevos métodos mejoran la traducción de habla al centrarse en la información contextual.

2025-09-02T22:24:45+00:00 ― 6 minilectura

Sonido Avanzando la tecnología de voz con datos de alternancia de código

Un nuevo método mejora el reconocimiento de voz para usuarios que cambian de código.

2025-09-02T21:36:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Un enfoque universal para mejorar el habla

Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.

2025-09-02T02:10:10+00:00 ― 6 minilectura

Sonido El auge de los subtítulos automáticos en audio

Explorando los avances en la subtitulación automática de audio y su impacto en la accesibilidad.

2025-09-02T01:21:35+00:00 ― 6 minilectura

Computación y lenguaje Documentando Lenguas en Peligro de Extinción con IGT

Un nuevo método apoya la preservación de las lenguas en peligro a través de una documentación detallada.

2025-08-27T17:35:42+00:00 ― 9 minilectura

Procesado de Audio y Voz Evaluando Modelos de Procesamiento de Voz con SUPERB

Un nuevo marco para evaluar modelos base en tareas de habla.

2025-08-11T09:31:05+00:00 ― 9 minilectura

Electrones fuertemente correlacionados Estados Magnéticos en Cuasicristales Icosaédricos

Explorando estados de erizo y anti-erizo en materiales magnéticos únicos.

2025-08-03T10:24:48+00:00 ― 6 minilectura

Procesado de Audio y Voz Reduciendo la Interferencia para un Habla Más Clara

Un nuevo sistema mejora la claridad del habla en entornos con múltiples hablantes.

2025-08-02T14:10:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Presentando el Modelo 4D en el Reconocimiento de Voz

Un nuevo modelo mejora el reconocimiento de voz usando múltiples métodos de decodificación.

2025-08-01T01:44:35+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz automático

Nuevos métodos mejoran la precisión y eficiencia en los sistemas de reconocimiento de voz.

2025-07-22T03:41:05+00:00 ― 8 minilectura

Procesado de Audio y Voz SynesLM: Avanzando la Tecnología de Voz Audiovisual

Un nuevo modelo integra datos de audio y visuales para el reconocimiento y la traducción del habla.

2025-07-06T20:04:15+00:00 ― 7 minilectura

Computación y lenguaje Traducción en Tiempo Real: Cerrando Brechas Lingüísticas

Este sistema traduce el habla en inglés a texto en alemán al instante para una comunicación sin interrupciones.

2025-06-27T20:53:06+00:00 ― 7 minilectura

Inmunología Variantes de COVID-19 y Respuestas a las Vacunas: Lo Que Sabemos

Nuevas variantes de COVID-19 están desafiando las vacunas actuales y subrayan la necesidad de seguir investigando.

2025-06-15T20:20:03+00:00 ― 5 minilectura

Sonido ESPnet-EZ: Simplificando el desarrollo de modelos de voz

Una herramienta fácil de usar para ajustar modelos de voz sin necesidad de código complicado.

2025-06-11T15:12:30+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Reconocimiento de Voz con LLMs

Explorando el desafío GenSEC para mejorar la precisión de la transcripción de voz.

2025-06-10T18:57:55+00:00 ― 6 minilectura

Computación y lenguaje Avances en Sistemas de Traducción de Voz Multilingüe

Nuevos métodos mejoran la precisión y eficiencia de la traducción para varios idiomas.

2025-06-10T16:14:30+00:00 ― 7 minilectura

Computación y lenguaje Avances en la tecnología de texto a voz: Alineación de preferencias

Descubre cómo la alineación de preferencias mejora los sistemas de texto a voz para ofrecer mejores experiencias a los usuarios.

2025-06-10T06:53:36+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voces Usando i-Vectores

Un estudio muestra que los i-vectores pueden competir con modelos complejos en el reconocimiento de hablantes.

2025-06-10T06:49:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Elecciones de diseño que impactan el rendimiento del modelo de voz

Un estudio sobre cómo las elecciones de diseño afectan los modelos de lenguaje de base.

2025-06-10T06:00:35+00:00 ― 8 minilectura

Procesado de Audio y Voz EVA: Una Nueva Era en el Reconocimiento de Voz Audiovisual

EVA combina señales de audio y visuales para mejorar la precisión del reconocimiento de voz.

2025-06-07T22:08:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Evaluando Códecs de Audio Neurales: Perspectivas del Desafío Codec-SUPERB

Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.

2025-06-05T06:58:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en códecs neuronales con ESPnet-Codec

ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.

2025-06-03T03:09:30+00:00 ― 8 minilectura

Sonido Avances en el Reconocimiento Automático de Voz

Nuevos métodos mejoran cómo las máquinas reconocen el lenguaje hablado.

2025-04-20T10:37:12+00:00 ― 9 minilectura

Sonido Conoce a VERSA: Tu Compañero de Evaluación de Audio

VERSA evalúa la calidad de voz, audio y música de manera efectiva.

2025-01-28T09:33:18+00:00 ― 10 minilectura

Procesado de Audio y Voz Reconocimiento de voz audiovisual: Una nueva frontera

Descubre cómo AV-ASR combina audio y visuales para mejorar el reconocimiento de voz.

2025-01-24T21:39:36+00:00 ― 7 minilectura