Yingyan Celine Lin

Pesquisa sobre como melhorar a eficiência de modelos de linguagem usando atenção linear e decodificação especulativa.

2025-07-30T11:38:36+00:00 ― 8 min ler

Explorando como os sinks de atenção impactam o desempenho dos modelos de linguagem e apresentando uma técnica de calibração.

2025-07-25T11:02:12+00:00 ― 7 min ler

Um novo framework melhora como os grandes modelos de linguagem podem funcionar em dispositivos de borda.

2025-07-25T10:54:18+00:00 ― 9 min ler

Um novo sistema melhora a adaptabilidade de grandes modelos de linguagem em diferentes dispositivos.

2025-05-22T21:38:15+00:00 ― 5 min ler