Pesquisadores desenvolvem uma técnica pra proteger palavras importantes em dados de texto.
― 5 min ler
Ciência de ponta explicada de forma simples
Pesquisadores desenvolvem uma técnica pra proteger palavras importantes em dados de texto.
― 5 min ler
Um estudo sobre o impacto do ICL e SFT na estrutura de modelos de linguagem.
― 7 min ler
Examinando o papel da atenção em diferentes camadas nos modelos de linguagem.
― 5 min ler
Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.
― 5 min ler
Uma nova forma de avaliar modelos de linguagem de maneira eficiente.
― 8 min ler
Estudo mostra que ajustar LLMs com TMs melhora a qualidade da tradução para as organizações.
― 7 min ler
Tecnologia inovadora ajuda a monitorar e avaliar o declínio cognitivo em pacientes com demência.
― 7 min ler
Um jeito de construir Grafos de Conhecimento a partir de documentos brutos de forma eficiente.
― 7 min ler
Um novo método melhora como as máquinas analisam gráficos para ter insights melhores.
― 7 min ler
Estudo investiga as tendências de performance dos modelos de linguagem coreana ao longo de onze meses.
― 7 min ler
Um novo método melhora a capacidade dos agentes de aprender com os erros em ambientes virtuais.
― 8 min ler
Novos métodos enfrentam os desafios de rótulos desbalanceados em NER para a saúde.
― 7 min ler
Usando modelos avançados pra avaliar melhor ideias de pesquisa na academia.
― 8 min ler
Novos métodos ligam metadados a grafos de conhecimento pra uma melhor interpretação dos dados.
― 6 min ler
Um sistema pra melhorar o suporte de TI usando geração aumentada por recuperação.
― 7 min ler
A CAST oferece uma maneira precisa de lidar com as respostas dos modelos de linguagem.
― 8 min ler
Este artigo apresenta o chunking tardio pra melhorar a recuperação de texto, mantendo o contexto.
― 6 min ler
O Paper Copilot ajuda os pesquisadores a navegar pela literatura científica de forma eficiente.
― 6 min ler
Pesquisas mostram como a programação influencia as habilidades dos modelos de linguagem em várias tarefas.
― 5 min ler
RLPF melhora a resumização de dados do usuário pra previsões melhores.
― 6 min ler
Melhorando a identificação de palavras faladas através de pistas visuais em línguas com poucos recursos.
― 8 min ler
Esse estudo analisa como os modelos de linguagem aprendem com exemplos e conhecimento passado.
― 10 min ler
A KnoWoGen oferece um sistema novo para criar conjuntos de dados em trabalho de conhecimento, lidando com limitações importantes.
― 6 min ler
Aprimorando a tradução automática para o idioma Karakalpak, que tem poucos recursos, com novos conjuntos de dados.
― 5 min ler
O Fast Forward melhora a eficiência do treinamento de baixo rank para modelos de linguagem.
― 7 min ler
Esse artigo fala sobre MLSAEs e o papel deles em examinar as camadas de modelos de linguagem.
― 6 min ler
Este estudo avalia modelos de linguagem grandes como juízes em tarefas de raciocínio matemático.
― 6 min ler
Um novo método pra prever traços de personalidade a partir de posts online usando dados filtrados.
― 8 min ler
Este estudo analisa o papel dos scores de confiança em melhorar o desempenho de OCR.
― 7 min ler
Um novo método melhora a geração de código usando várias linguagens de programação.
― 7 min ler
UI-JEPA melhora como os sistemas preveem as ações dos usuários a partir das interações na tela.
― 6 min ler
ECHO combina diferentes padrões de raciocínio pra resolver problemas melhor em modelos de linguagem.
― 7 min ler
Pesquisadores criam um método pra testar intervenções pra transtornos alimentares sem riscos reais.
― 7 min ler
O conjunto de dados MeMo mostra como as conversas em grupo são lembradas.
― 6 min ler
Um novo conjunto de dados melhora a tecnologia de fala multilíngue na Índia.
― 6 min ler
Este artigo analisa os riscos de red-teaming em grandes modelos de linguagem usados nos negócios.
― 4 min ler
SSR melhora o desempenho dos modelos de linguagem enquanto mantém suas habilidades gerais.
― 7 min ler
O método Untie the Knots melhora o manejo de textos longos em modelos de linguagem.
― 6 min ler
Pesquisas mostram como as camadas em LLMs contribuem igualmente para as previsões.
― 7 min ler
Esse artigo fala sobre as vantagens de simplificar modelos de transformer para tarefas de fala.
― 5 min ler