MMLU-Pro desafia modelos de linguagem com perguntas mais difíceis e mais opções de respostas.
― 8 min ler
Ciência de ponta explicada de forma simples
MMLU-Pro desafia modelos de linguagem com perguntas mais difíceis e mais opções de respostas.
― 8 min ler
Um novo método ajuda a equilibrar os dados de treinamento pra melhorar o desempenho da IA.
― 9 min ler
Analisando as dificuldades de traduzir linguagem metafórica na tradução automática.
― 7 min ler
O GIEBench avalia as respostas empáticas de LLMs com base em identidades de grupos diversos.
― 8 min ler
DDK melhora a destilação de conhecimento, deixando modelos de linguagem menores mais eficientes.
― 6 min ler
I-SHEEP permite que modelos de linguagem grandes aprendam continuamente a partir de dados gerados.
― 6 min ler
Explorando como o aprendizado de preferências melhora o alinhamento do modelo de linguagem com as expectativas humanas.
― 9 min ler
Uma nova ferramenta avalia o desempenho de modelos de linguagem grandes em diferentes tipos de dados.
― 5 min ler
Pesquisadores usam falhas de jogos pra ensinar IA sobre senso comum físico.
― 6 min ler