Uma nova ferramenta ajuda a avaliar as habilidades de programação em JavaScript e os níveis de proficiência.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma nova ferramenta ajuda a avaliar as habilidades de programação em JavaScript e os níveis de proficiência.
― 6 min ler
Esse sistema ajuda a pensar e tomar decisões através de um raciocínio estruturado.
― 7 min ler
Este estudo analisa como os recrutadores veem as ferramentas de IA na contratação de engenheiros de software.
― 7 min ler
Este artigo fala sobre um novo sistema de classificação pra avaliar modelos de linguagem de forma mais justa.
― 6 min ler
O LongGenBench avalia modelos de linguagem grandes na geração de textos longos de alta qualidade.
― 7 min ler
Modelos de Linguagem Grande melhoram a eficiência na avaliação de respostas médicas.
― 8 min ler
Esse estudo avalia modelos de machine learning pra detectar lixo nos rios.
― 5 min ler
Analisando questões éticas no uso de modelos de linguagem para condições psiquiátricas.
― 10 min ler
A VisScience testa grandes modelos em raciocínio científico usando texto e imagens.
― 5 min ler
Esse estudo avalia como os LLMs lidam com consultas SPARQL e Grafos de Conhecimento.
― 5 min ler
Uma análise de como sistemas de recuperação funcionam em ambientes de dados em mudança.
― 6 min ler
Um novo método melhora a forma como os modelos de linguagem seguem instruções complexas.
― 6 min ler
Apresentando uma estrutura inovadora para testar interações de modelos de linguagem em cenários de RPG.
― 10 min ler
TeXBLEU oferece um jeito confiável de avaliar expressões LaTeX a partir de matemática falada.
― 6 min ler
Uma estrutura pra melhorar o desempenho da IA em tarefas visuais imitando os julgamentos humanos.
― 7 min ler
Uma nova forma de avaliar a qualidade na geração de imagens de ressonância magnética do cérebro.
― 7 min ler
Explora a ascensão e o impacto dos Modelos Fundamentais na inteligência artificial.
― 6 min ler
Um novo modelo melhora a precisão das previsões para proteínas que se ligam ao DNA em plantas.
― 8 min ler
Usar LLMs pra gerar características claras de textos científicos pra fazer previsões melhores.
― 7 min ler
Um novo sistema de índice visa melhorar o manejo de distúrbios de deglutição em idosos.
― 7 min ler
Usar modelos de linguagem mais fracos pode melhorar a alinhamento da IA de forma eficiente.
― 6 min ler
Melhorar as avaliações de robôs pode trazer insights mais profundos sobre suas capacidades.
― 9 min ler
Um novo conjunto de dados tem como objetivo melhorar os sistemas de QA para o Alcorão e Ahadith.
― 10 min ler
Esse estudo analisa o preconceito de gênero nas avaliações de professores feitas por modelos de IA.
― 12 min ler
Robôs autoconscientes conseguem ajustar seus movimentos pra interagir de forma mais segura.
― 7 min ler
Um novo método aumenta a geração de dados de textura para modelos de aprendizado de máquina.
― 7 min ler
Muitos sobreviventes de câncer na infância enfrentam perda auditiva por causa do tratamento.
― 6 min ler
O THaMES oferece um esquema pra reduzir as alucinações em modelos de linguagem.
― 7 min ler
Um método pra avaliar as avaliações de agentes de IA quanto à segurança e confiabilidade.
― 9 min ler
Um novo benchmark melhora a avaliação de sistemas de detecção de paráfrases.
― 5 min ler
A IA pode ajudar a criar materiais de estudo eficazes para exames médicos.
― 7 min ler
Aprenda como criar gráficos de conhecimento eficazes para aplicações industriais.
― 7 min ler
Novo framework e conjunto de dados melhoram a detecção de excitação em estudos de sono.
― 6 min ler
Um novo framework avalia o conhecimento médico em modelos de linguagem grandes.
― 6 min ler
Este artigo fala sobre a justiça na escolha de candidatos para instituições em meio a avaliações tendenciosas.
― 9 min ler
Forester simplifica o aprendizado de máquina para usuários de R com um pacote fácil de usar.
― 7 min ler
Novos métodos melhoram o realismo dos reflexos em espelhos em imagens geradas por computador.
― 6 min ler
Um estudo sobre como agentes de IA seguem regras definidas pelos usuários usando o conjunto de dados ACS.
― 10 min ler
Este estudo avalia o quanto os modelos de linguagem ajudam programadores iniciantes com comentários de código.
― 5 min ler
Avaliando o papel dos modelos de linguagem nos julgamentos de relevância para recuperação de informação.
― 7 min ler