Zhongzhi Yu

Explorando como os sinks de atenção impactam o desempenho dos modelos de linguagem e apresentando uma técnica de calibração.

2025-07-25T11:02:12+00:00 ― 7 min ler

Um novo framework melhora como os grandes modelos de linguagem podem funcionar em dispositivos de borda.

2025-07-25T10:54:18+00:00 ― 9 min ler

O KVMerger reduz o uso de memória em modelos de linguagem enquanto mantém o desempenho através da fusão eficaz de estados.

2025-07-15T02:19:06+00:00 ― 7 min ler

Um novo sistema melhora a adaptabilidade de grandes modelos de linguagem em diferentes dispositivos.

2025-05-22T21:38:15+00:00 ― 5 min ler