Arman Cohan

Este estudo avalia quando expansões melhoram ou prejudicam o desempenho da recuperação de informações.

2025-09-26T14:07:30+00:00 ― 4 min ler

Este estudo analisa as capacidades de LLM em produzir dados estruturados com precisão.

2025-09-26T00:57:30+00:00 ― 6 min ler

Uma olhada profunda em como os LLMs convertem linguagem em código em várias tarefas.

2025-09-20T06:58:18+00:00 ― 10 min ler

Um novo modelo de linguagem aberto pra pesquisa e inovação em processamento de linguagem natural.

2025-09-12T09:14:24+00:00 ― 7 min ler

Analisando vulnerabilidades e estratégias de segurança para agentes científicos movidos por LLM.

2025-09-10T13:23:42+00:00 ― 8 min ler

Estudo revela uma sobreposição de dados significativa que afeta as avaliações de modelos de linguagem na geração de código.

2025-09-01T02:16:12+00:00 ― 7 min ler

Um novo conjunto de dados ajuda os modelos de IR a se adaptarem a instruções complexas pra ter um desempenho melhor.

2025-08-26T18:49:00+00:00 ― 3 min ler

A contaminação de dados afeta bastante a avaliação de modelos de linguagem grandes.

2025-07-26T10:12:36+00:00 ― 6 min ler

Dois métodos melhoram a precisão das avaliações de textos gerados por IA.

2025-05-29T22:25:03+00:00 ― 7 min ler

Um novo marco avalia modelos para verificar reivindicações financeiras em documentos complexos.

2025-05-27T17:33:54+00:00 ― 8 min ler

ChemSafetyBench testa chatbots sobre segurança química e conhecimento.

2025-05-06T00:39:52+00:00 ― 6 min ler