Analisando os preconceitos em modelos de linguagem usados para análise e soluções de saúde mental.
― 10 min ler
Ciência de ponta explicada de forma simples
Analisando os preconceitos em modelos de linguagem usados para análise e soluções de saúde mental.
― 10 min ler
Usar modelos de linguagem melhora as previsões para dados tabulares em várias áreas.
― 7 min ler
Novo método melhora a eficácia na conversa em modelos de linguagem através de técnicas de planejamento.
― 8 min ler
As crianças aprendem a língua juntando significado e gramática através de inputs visuais e textuais.
― 7 min ler
Aprenda como os transcodificadores ajudam a esclarecer modelos de linguagem complexos.
― 6 min ler
Um novo método melhora os testes para modelos de linguagem usando dados reais de usuários.
― 7 min ler
Analisando as limitações de grandes modelos de linguagem em entender relações de código.
― 9 min ler
Um framework melhora a geração de código para linguagens especializadas usando documentação.
― 8 min ler
Uma análise de como os LLMs aprendem e retêm informações factuais.
― 6 min ler
Um novo conjunto de dados melhora o raciocínio em múltiplos documentos para perguntas de elegibilidade.
― 10 min ler
Uma nova abordagem pra melhorar as avaliações de segurança dos sistemas de IA usando perspectivas diversas.
― 6 min ler
Um novo framework ajuda modelos de linguagem a aprenderem linguagem simbólica sem a ajuda de humanos.
― 8 min ler
Analisando a memorização em modelos de conclusão de código e suas implicações de privacidade.
― 9 min ler
O TreeInstruct ajuda os alunos a depurar com métodos de questionamento eficazes.
― 7 min ler
A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.
― 8 min ler
Um conjunto de ferramentas pra avaliar o desempenho de modelos aumentados por recuperação em domínios específicos.
― 12 min ler
O TourRank melhora a classificação de documentos usando uma abordagem baseada em torneios.
― 6 min ler
Analisando como o viés cultural afeta a compreensão de imagens pela IA.
― 10 min ler
Um estudo avaliando preconceitos culturais em modelos de linguagem populares.
― 7 min ler
Esse estudo propõe um método pra medir diferenças culturais usando redes sociais.
― 8 min ler
Novos métodos revelam desafios em desaprender conhecimento de modelos de linguagem.
― 7 min ler
A Anotação de Erros em Span oferece um jeito rápido e confiável de avaliar a qualidade da tradução.
― 6 min ler
Avaliar como modelos de linguagem lidam com pistas culturais em tarefas reais.
― 9 min ler
O STimage-1K4M junta imagens detalhadas e dados genéticos pra melhorar a pesquisa sobre doenças.
― 8 min ler
Os agentes de linguagem estão ficando mais adaptáveis, melhorando suas habilidades de comunicação e resolução de problemas.
― 5 min ler
Pesquisadores desenvolvem o conjunto de dados GECO e o GECOBench pra enfrentar o viés de gênero na IA.
― 7 min ler
Novo método melhora a geração aumentada por recuperação para responder perguntas complexas.
― 7 min ler
Explora os desafios de supervisionar modelos de IA avançados com contrapartes mais fracas.
― 7 min ler
Este artigo apresenta métodos para detectar sites não confiáveis usando palavras-chave.
― 8 min ler
Um estudo sobre o desempenho de modelos de linguagem menores e abertos em várias tarefas.
― 7 min ler
O Refiner melhora as respostas do modelo de linguagem reestruturando as informações recuperadas.
― 8 min ler
Esse artigo analisa como os LLMs se saem em tarefas de raciocínio silogístico.
― 6 min ler
Um novo método reescreve textos pra ficar mais fácil de entender em diferentes níveis de leitura.
― 6 min ler
O GUICourse tem como objetivo melhorar a interação com interfaces digitais através de conjuntos de dados específicos para agentes de GUI.
― 5 min ler
A VideoVista oferece uma avaliação completa para modelos de perguntas e respostas em vídeo.
― 7 min ler
Este estudo revela como os modelos de linguagem mudam de comportamento durante o treinamento.
― 7 min ler
Este estudo analisa métodos para aumentar a empatia das máquinas através de contar histórias.
― 9 min ler
Um estudo sobre os processos de tomada de decisão de modelos de linguagem grandes.
― 5 min ler
Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.
― 6 min ler
Esse artigo analisa o verdadeiro significado da democratização na IA.
― 7 min ler