Ruihua Song

ViCo melhora a geração de comentários legais para vídeos online.

2025-10-05T12:44:30+00:00 ― 6 min ler

Um novo framework melhora a precisão das legendas de imagens e reduz erros.

2025-06-20T09:09:36+00:00 ― 6 min ler

A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.

2025-06-07T22:08:20+00:00 ― 5 min ler

O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.

2025-06-03T03:09:30+00:00 ― 8 min ler

Novo método melhora interações realistas em animações de personagens.

2025-02-05T11:49:12+00:00 ― 7 min ler

Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.

2025-01-24T21:39:36+00:00 ― 7 min ler