Hongning Wang

Analisando a precisão das informações de saúde nos resultados de busca.

2025-09-13T21:50:36+00:00 ― 7 min ler

Esse artigo apresenta um método para clientes com objetivos diversos em aprendizado federado de bandits.

2025-09-03T00:29:06+00:00 ― 7 min ler

Uma nova abordagem pra recompensar a superotimização em modelos de linguagem usando estimativa de incerteza.

2025-08-31T04:16:54+00:00 ― 8 min ler

O ChatGLM-RLHF melhora as interações de IA através de feedback humano e métodos de treinamento avançados.

2025-08-23T14:27:00+00:00 ― 6 min ler

Os modelos GLM-4 mostram melhorias nas capacidades de entender e gerar linguagem.

2025-07-27T06:52:54+00:00 ― 10 min ler

Um novo método pra avaliar quão bem os LLMs entendem e aplicam regras.

2025-06-20T19:41:36+00:00 ― 6 min ler

Aprenda como o feedback humano molda as respostas dos modelos de linguagem de IA.

2025-04-02T03:58:57+00:00 ― 9 min ler

Uma nova abordagem pra melhorar o seguimento de instruções em modelos de linguagem.

2025-02-28T18:21:36+00:00 ― 7 min ler