Ruoyu Sun

AceGPT melhora o processamento da língua árabe adaptado à cultura e valores locais.

2025-09-23T18:42:42+00:00 ― 6 min ler

Esse artigo explora os desafios de otimização nos Transformers e a eficácia do Adam em comparação ao SGD.

2025-09-03T21:48:54+00:00 ― 7 min ler

Adam-mini reduz o uso de memória para treinar grandes modelos de linguagem, mantendo o desempenho.

2025-07-24T23:19:06+00:00 ― 7 min ler

Uma nova abordagem pra resolver de forma eficiente problemas de programação linear em grande escala.

2025-07-20T19:42:52+00:00 ― 6 min ler

O MoFO ajuda modelos de linguagem grandes a manter conhecimento durante o ajuste fino sem perder desempenho.

2025-07-05T01:30:00+00:00 ― 6 min ler

Uma nova abordagem melhora as respostas dos modelos de linguagem e reduz o overfitting.

2025-06-20T07:19:00+00:00 ― 7 min ler

Descubra como o PDQP-Net agiliza a resolução de Programas Quadráticos Convexos.

2025-04-15T23:07:10+00:00 ― 7 min ler