Novas métricas melhoram a eficácia dos grandes modelos de linguagem na educação.
― 8 min ler
Ciência de ponta explicada de forma simples
Novas métricas melhoram a eficácia dos grandes modelos de linguagem na educação.
― 8 min ler
Este artigo analisa como grandes modelos de linguagem lembram informações dos dados de treinamento.
― 8 min ler
Adaptar modelos multilíngues pode melhorar o desempenho para línguas urálicas menos usadas.
― 7 min ler
Explore o papel da classificação ordinal e o impacto dos modelos de linguagem pré-treinados.
― 7 min ler
Explore como o DETAIL melhora a compreensão da aprendizagem em contexto em modelos de linguagem.
― 7 min ler
A TPO oferece um novo método pra alinhar modelos de linguagem com as preferências humanas de forma eficiente.
― 7 min ler
ThReaD melhora o desempenho dos LLMs em tarefas complexas com a gestão dinâmica de threads.
― 6 min ler
Esse artigo analisa os riscos de ajustar modelos de linguagem pra segurança.
― 4 min ler
Uma nova abordagem melhora a diversidade dos prompts para modelos de linguagem mais seguros.
― 8 min ler
Pesquisas mostram os desafios da detecção de marcas d'água em grandes modelos de linguagem.
― 9 min ler
Este estudo apresenta um sistema para melhorar a precisão do modelo de linguagem usando desafios adversariais.
― 8 min ler
Aprenda como equipes adaptativas melhoram o desempenho nas tarefas com agentes de modelo de linguagem.
― 8 min ler
O MAP-Neo busca transparência e desempenho na modelagem de linguagem em IA.
― 6 min ler
Analisando os desafios e soluções na marcação de LLM pra evitar uso indevido.
― 7 min ler
Novos recursos melhoram a avaliação dos modelos de linguagem coreana.
― 5 min ler
Pesquisas mostram que instruções variadas melhoram o desempenho de modelos de linguagem em tarefas desconhecidas.
― 8 min ler
A pesquisa apresenta um método pra melhorar a tomada de decisão em agentes de modelo de linguagem.
― 10 min ler
Esse estudo analisa como os LLMs lidam com raciocínio em cenários abstratos e contextuais.
― 6 min ler
O Block Transformer melhora a velocidade e eficiência do processamento de texto em modelos de linguagem.
― 7 min ler
Testes recentes mostram que os LLMs têm fraquezas em raciocínio simples, apesar de terem boas notas nos benchmarks.
― 6 min ler
Um guia pra transformar código Python não idiomático usando técnicas modernas.
― 7 min ler
Este estudo analisa como os LLMs lidam com mudanças nas tarefas de resumo.
― 9 min ler
Este estudo explora como criar frases que mantenham significados específicos usando o FrameNet.
― 10 min ler
Esse estudo avalia a capacidade do GPT-4 de extrair dados da literatura de ciência dos materiais.
― 8 min ler
Ataques de jamming podem atrapalhar sistemas de geração aumentada por recuperação bloqueando as respostas.
― 7 min ler
Esse artigo avalia a capacidade dos modelos de linguagem de simular ambientes de jogo.
― 6 min ler
Uma nova abordagem para avaliar estratégias de raciocínio com foco nos custos computacionais.
― 8 min ler
MedExQA estabelece um novo padrão para avaliar modelos de linguagem médica com foco em explicações.
― 8 min ler
Estudo avalia como os LLMs raciocinam além do contexto imediato.
― 6 min ler
Explorando as limitações da Otimização Direta de Preferências no treinamento de modelos de linguagem.
― 7 min ler
Avaliar como os modelos de linguagem se saem em pesquisas em diferentes áreas acadêmicas.
― 8 min ler
Uma nova ferramenta pra avaliar a melhoria contínua dos modelos de linguagem através do feedback.
― 7 min ler
Um novo modelo avalia os modelos de linguagem em inteligência emocional e criatividade.
― 9 min ler
Novos métodos melhoram a performance dos modelos de linguagem através de uma seleção melhor de exemplos.
― 9 min ler
ReadCtrl ajuda modelos de linguagem a combinar melhor a complexidade do texto com as habilidades dos leitores.
― 6 min ler
A GAMA melhora o processamento de áudio juntando informações de som e linguagem.
― 7 min ler
A SciEx revela os pontos fortes e os desafios dos LLMs na avaliação científica.
― 8 min ler
Esse estudo mostra como o BERT aprende fatos sobre COVID-19 através de treinamento contínuo.
― 5 min ler
Um novo teste de referência avalia as habilidades dos LLMs com formatos de dados estruturados.
― 7 min ler
Um novo framework melhora como os agentes LLM aprendem através de um guia de processo detalhado.
― 9 min ler