Aswin RRV

A TPO oferece um novo método pra alinhar modelos de linguagem com as preferências humanas de forma eficiente.

2025-08-06T22:11:00+00:00 ― 7 min ler

A pesquisa busca melhorar como os LLMs lidam com informações enganosas.

2025-08-01T04:59:12+00:00 ― 7 min ler

Uma análise do desempenho de LLM em quebra-cabeças de grade pra avaliar habilidades de raciocínio.

2025-07-09T18:51:54+00:00 ― 8 min ler