O dataset MalAlgoQA avalia o raciocínio de Modelos de Linguagem Grandes em cenários contrafactuais.
― 7 min ler
Ciência de ponta explicada de forma simples
O dataset MalAlgoQA avalia o raciocínio de Modelos de Linguagem Grandes em cenários contrafactuais.
― 7 min ler
Pesquisas mostram que ajustar com dados em inglês pode melhorar a busca de informações multilíngues.
― 6 min ler
Um sistema que gera receitas de comida a partir de imagens de comida.
― 6 min ler
HIGHT melhora modelos de linguagem usando informações hierárquicas de dados em grafo.
― 8 min ler
Esse estudo analisa como dados visuais e textuais afetam o desempenho do modelo.
― 8 min ler
MathCAMPS oferece uma nova forma de avaliar o raciocínio matemático em modelos de linguagem.
― 11 min ler
Esse trabalho foca em uma representação numérica melhor usando embeddings de dígitos pra fazer previsões mais precisas.
― 9 min ler
CD-T melhora a compreensão dos modelos de transformer, aumentando a interpretação e a confiança.
― 5 min ler
Pesquisas mostram que modelos de linguagem têm dificuldade com raciocínio falso, levantando preocupações sobre segurança.
― 6 min ler
Uma nova abordagem melhora o raciocínio em modelos de linguagem gerando erros controlados.
― 7 min ler
Analisando a relação entre técnicas de privacidade e preconceitos em modelos de linguagem.
― 7 min ler
Esse artigo examina métodos para avaliar resumos de texto usando modelos de linguagem grandes.
― 9 min ler
Novo método melhora o desempenho dos sistemas de ASR com diferentes sotaques através de dicionários especializados.
― 6 min ler
BAPO melhora modelos de linguagem enquanto mantém o conhecimento essencial e as preferências dos usuários.
― 7 min ler
Novos métodos melhoram a precisão e a eficiência nos sistemas de reconhecimento de fala.
― 7 min ler
Melhorias no modelo BERT pra lidar melhor com documentos legais em turco.
― 7 min ler
Novos métodos melhoram a privacidade e a coerência usando colocações em dados de linguagem.
― 7 min ler
Um novo método pra reescrever texto que garante privacidade e mantém o sentido.
― 6 min ler
Um conjunto de dados pra melhorar a correção automática e o feedback na educação em engenharia.
― 7 min ler
Esse estudo explica como os transformers usam o contexto na previsão de linguagem.
― 10 min ler
Uma nova ferramenta aumenta a precisão da análise da Teoria da Representação do Discurso.
― 6 min ler
Apresentando o GRASP, um padrão para avaliar o raciocínio espacial em modelos de linguagem.
― 8 min ler
Explorando a eficácia dos LLMs na tomada de decisões através de cenários de Dueling Bandits.
― 10 min ler
Modelos menores de código aberto oferecem soluções eficazes para a pontuação automatizada de redações e respostas curtas.
― 10 min ler
Nomes de diferentes países influenciam como os classificadores interpretam conteúdo de redes sociais.
― 5 min ler
Explorando como a empatia melhora a comunicação com robôs e assistentes virtuais.
― 8 min ler
Estudo revela riscos de privacidade e preconceitos raciais nas transmissões da polícia de Chicago.
― 6 min ler
Analisando como os memes moldam opiniões através de técnicas persuasivas.
― 5 min ler
Um novo padrão pra avaliar grandes modelos de linguagem em testes de hipótese.
― 8 min ler
Um modelo pra reduzir viés em IA de linguagem sem perder a precisão.
― 8 min ler
Avaliando métodos pra melhorar o desempenho em contextos longos em modelos de linguagem.
― 8 min ler
ReGround3D melhora a compreensão das instruções humanas em ambientes 3D.
― 5 min ler
Um novo método melhora a seleção de misturas de dados para o treinamento de modelos de linguagem.
― 5 min ler
Um novo método melhora a eficiência e eficácia do LoRA em aprendizado de máquina.
― 7 min ler
Explorando como dados sintéticos moldam modelos de machine learning e seu comportamento.
― 7 min ler
Métodos simplificados superam agentes complexos na resolução de problemas de software.
― 9 min ler
DogeRM junta modelos gerais e específicos pra dar um up na performance dos modelos de linguagem.
― 6 min ler
Um novo método melhora os comandos dos usuários para resultados de modelo de linguagem mais seguros e eficazes.
― 5 min ler
Uma olhada na nova abordagem da Larimar sobre memória em modelos de linguagem.
― 6 min ler
O HyperLoader melhora o treinamento de modelos multitarefa usando técnicas inovadoras e hipernetworks.
― 7 min ler