Rishabh Agarwal

Pesquisa sobre como os Transformers melhoram a generalização para sequências mais longas em tarefas de adição.

2025-09-08T05:49:54+00:00 ― 8 min ler

Este artigo fala sobre usar classificação para funções de valor em aprendizado por reforço profundo.

2025-08-23T12:51:08+00:00 ― 7 min ler

Esse artigo analisa os benefícios do aprendizado com várias amostras em modelos de linguagem.

2025-08-19T08:00:48+00:00 ― 7 min ler

SiT melhora a capacidade dos agentes de generalizar em aprendizado por reforço através de simetria e atenção.

2025-07-25T16:49:48+00:00 ― 7 min ler

Pesquisas mostram como a decodificação MBR melhora a qualidade da tradução em modelos menores.

2025-07-13T00:09:12+00:00 ― 5 min ler

Gemma 2 oferece alta performance em um tamanho compacto para tarefas de linguagem.

2025-07-04T12:59:30+00:00 ― 7 min ler

Estudo revela que modelos mais baratos podem produzir dados de treinamento melhores para tarefas de raciocínio.

2025-06-20T08:30:06+00:00 ― 6 min ler

Esse método ajuda as IAs a aprender criando e resolvendo desafios.

2025-05-26T00:12:48+00:00 ― 7 min ler