Sanath Narayan

O Lip2Vec melhora o reconhecimento visual da fala usando menos dados rotulados.

2025-09-27T01:21:50+00:00 ― 8 min ler

Analisando como diferentes modelos para imagens e texto podem funcionar juntos de forma eficaz.

2025-09-17T23:00:48+00:00 ― 7 min ler

Um novo método melhora o reconhecimento de ações em vídeos usando linguagem contextual.

2025-07-25T21:50:00+00:00 ― 9 min ler

Uma nova estrutura melhora a conexão entre imagens e texto.

2025-06-03T20:03:12+00:00 ― 8 min ler