A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.
― 8 min ler
Ciência de ponta explicada de forma simples
A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.
― 8 min ler
Um conjunto de ferramentas pra avaliar o desempenho de modelos aumentados por recuperação em domínios específicos.
― 12 min ler
O TourRank melhora a classificação de documentos usando uma abordagem baseada em torneios.
― 6 min ler
Analisando como o viés cultural afeta a compreensão de imagens pela IA.
― 10 min ler
Um estudo avaliando preconceitos culturais em modelos de linguagem populares.
― 7 min ler
Esse estudo propõe um método pra medir diferenças culturais usando redes sociais.
― 8 min ler
Novos métodos revelam desafios em desaprender conhecimento de modelos de linguagem.
― 7 min ler
A Anotação de Erros em Span oferece um jeito rápido e confiável de avaliar a qualidade da tradução.
― 6 min ler
Avaliar como modelos de linguagem lidam com pistas culturais em tarefas reais.
― 9 min ler
O STimage-1K4M junta imagens detalhadas e dados genéticos pra melhorar a pesquisa sobre doenças.
― 8 min ler
Os agentes de linguagem estão ficando mais adaptáveis, melhorando suas habilidades de comunicação e resolução de problemas.
― 5 min ler
Pesquisadores desenvolvem o conjunto de dados GECO e o GECOBench pra enfrentar o viés de gênero na IA.
― 7 min ler
Novo método melhora a geração aumentada por recuperação para responder perguntas complexas.
― 7 min ler
Explora os desafios de supervisionar modelos de IA avançados com contrapartes mais fracas.
― 7 min ler
Este artigo apresenta métodos para detectar sites não confiáveis usando palavras-chave.
― 8 min ler
Um estudo sobre o desempenho de modelos de linguagem menores e abertos em várias tarefas.
― 7 min ler
O Refiner melhora as respostas do modelo de linguagem reestruturando as informações recuperadas.
― 8 min ler
Esse artigo analisa como os LLMs se saem em tarefas de raciocínio silogístico.
― 6 min ler
Um novo método reescreve textos pra ficar mais fácil de entender em diferentes níveis de leitura.
― 6 min ler
O GUICourse tem como objetivo melhorar a interação com interfaces digitais através de conjuntos de dados específicos para agentes de GUI.
― 5 min ler
A VideoVista oferece uma avaliação completa para modelos de perguntas e respostas em vídeo.
― 7 min ler
Este estudo revela como os modelos de linguagem mudam de comportamento durante o treinamento.
― 7 min ler
Este estudo analisa métodos para aumentar a empatia das máquinas através de contar histórias.
― 9 min ler
Um estudo sobre os processos de tomada de decisão de modelos de linguagem grandes.
― 5 min ler
Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.
― 6 min ler
Esse artigo analisa o verdadeiro significado da democratização na IA.
― 7 min ler
Este estudo analisa como a linguagem influencia os valores culturais em grandes modelos.
― 9 min ler
Um método pra identificar emoções e suas causas em dados não rotulados.
― 6 min ler
O L-ICV melhora a performance em perguntas visuais usando menos exemplos.
― 7 min ler
Esse artigo analisa como conceitos relacionais moldam a recuperação de conhecimento em modelos de linguagem grandes.
― 6 min ler
A APPL facilita o desenvolvimento com grandes modelos de linguagem usando uma sintaxe intuitiva, parecida com Python.
― 2 min ler
Analisando as raízes e implicações do viés na tecnologia de linguagem.
― 7 min ler
Modelos de linguagem de longo contexto facilitam tarefas complexas e melhoram a interação com a IA.
― 9 min ler
Um novo framework resolve desafios na destilação de conhecimento para dados com cauda longa.
― 9 min ler
Esse artigo examina maneiras de melhorar as habilidades de planejamento em grandes modelos de linguagem.
― 8 min ler
Um novo conjunto de dados melhora a compreensão de histórias em várias línguas.
― 8 min ler
Explorando os desafios de segurança trazidos por ataques adversariais em agentes multimodais.
― 7 min ler
Os modelos GLM-4 mostram melhorias nas capacidades de entender e gerar linguagem.
― 10 min ler
Esse artigo analisa como os LLMs respondem a perguntas complexas que envolvem múltiplos passos.
― 8 min ler
Um novo modelo combina LLMs e tradução automática pra melhorar o processamento de linguagem.
― 8 min ler