Uma estrutura pra melhorar o desempenho da IA em tarefas visuais imitando os julgamentos humanos.
― 7 min ler
Ciência de ponta explicada de forma simples
Uma estrutura pra melhorar o desempenho da IA em tarefas visuais imitando os julgamentos humanos.
― 7 min ler
Uma nova forma de avaliar a qualidade na geração de imagens de ressonância magnética do cérebro.
― 7 min ler
Explora a ascensão e o impacto dos Modelos Fundamentais na inteligência artificial.
― 6 min ler
Um novo modelo melhora a precisão das previsões para proteínas que se ligam ao DNA em plantas.
― 8 min ler
Usar LLMs pra gerar características claras de textos científicos pra fazer previsões melhores.
― 7 min ler
Um novo sistema de índice visa melhorar o manejo de distúrbios de deglutição em idosos.
― 7 min ler
Usar modelos de linguagem mais fracos pode melhorar a alinhamento da IA de forma eficiente.
― 6 min ler
Melhorar as avaliações de robôs pode trazer insights mais profundos sobre suas capacidades.
― 9 min ler
Um novo conjunto de dados tem como objetivo melhorar os sistemas de QA para o Alcorão e Ahadith.
― 10 min ler
Esse estudo analisa o preconceito de gênero nas avaliações de professores feitas por modelos de IA.
― 12 min ler
Robôs autoconscientes conseguem ajustar seus movimentos pra interagir de forma mais segura.
― 7 min ler
Um novo método aumenta a geração de dados de textura para modelos de aprendizado de máquina.
― 7 min ler
Muitos sobreviventes de câncer na infância enfrentam perda auditiva por causa do tratamento.
― 6 min ler
O THaMES oferece um esquema pra reduzir as alucinações em modelos de linguagem.
― 7 min ler
Um método pra avaliar as avaliações de agentes de IA quanto à segurança e confiabilidade.
― 9 min ler
Um novo benchmark melhora a avaliação de sistemas de detecção de paráfrases.
― 5 min ler
A IA pode ajudar a criar materiais de estudo eficazes para exames médicos.
― 7 min ler
Aprenda como criar gráficos de conhecimento eficazes para aplicações industriais.
― 7 min ler
Novo framework e conjunto de dados melhoram a detecção de excitação em estudos de sono.
― 6 min ler
Um novo framework avalia o conhecimento médico em modelos de linguagem grandes.
― 6 min ler
Este artigo fala sobre a justiça na escolha de candidatos para instituições em meio a avaliações tendenciosas.
― 9 min ler
Forester simplifica o aprendizado de máquina para usuários de R com um pacote fácil de usar.
― 7 min ler
Novos métodos melhoram o realismo dos reflexos em espelhos em imagens geradas por computador.
― 6 min ler
Um estudo sobre como agentes de IA seguem regras definidas pelos usuários usando o conjunto de dados ACS.
― 10 min ler
Este estudo avalia o quanto os modelos de linguagem ajudam programadores iniciantes com comentários de código.
― 5 min ler
Avaliando o papel dos modelos de linguagem nos julgamentos de relevância para recuperação de informação.
― 7 min ler
Uma nova métrica que melhora a avaliação da consistência factual em resumos automáticos.
― 6 min ler
Uma nova abordagem melhora os resumos das sessões de saúde mental através de um motor de planejamento.
― 9 min ler
O RAGProbe automatiza a avaliação de sistemas RAG, melhorando seu desempenho e confiabilidade.
― 7 min ler
Essa pesquisa apresenta métodos automáticos para avaliar a pulverização precisa na agricultura.
― 7 min ler
Melhorando avaliações através da Teoria da Resposta ao Item para um aprendizado de língua mais eficaz.
― 9 min ler
Um novo padrão avalia quão bem modelos de IA imitam a linguagem humana.
― 6 min ler
Um novo método melhora a precisão ao responder perguntas de tabelas ao combinar dois sistemas.
― 9 min ler
Um novo método para criar distrações interessantes em avaliações educacionais.
― 6 min ler
Um novo método pretende melhorar o texto alternativo para ícones de aplicativos móveis, ajudando usuários com deficiência visual.
― 5 min ler
DREAMS simplifica o aprendizado profundo para dados de EEG, promovendo transparência e práticas éticas.
― 8 min ler
Uma olhada em avaliar a confiabilidade das explicações da IA através da sensibilidade adversarial.
― 8 min ler
Modelos recentes melhoram a capacidade da IA de gerar e entender vários tipos de mídia.
― 6 min ler
O ARLBench facilita a sintonia de hiperparâmetros para aprendizado por reforço com ferramentas de benchmark eficientes.
― 9 min ler
Um modelo pra avaliar a qualidade da segmentação sem referências de verdade.
― 10 min ler