Descubra uma nova forma de melhorar a eficiência da avaliação em cálculo lambda.
― 8 min ler
Ciência de ponta explicada de forma simples
Descubra uma nova forma de melhorar a eficiência da avaliação em cálculo lambda.
― 8 min ler
Apresentando o SALSA-CLRS pra melhorar a avaliação de algoritmos usando grafos esparsos.
― 7 min ler
A métrica SQuArE melhora a avaliação de sistemas de QA através de múltiplas referências de resposta.
― 6 min ler
Um novo sistema pretende conectar usuários a profissionais de saúde por meio de classificação automatizada.
― 5 min ler
Avanços em resumir conversas entre médicos e pacientes melhoram a comunicação na telemedicina.
― 9 min ler
Explorando técnicas de prova pra avaliar funções em linguagens de programação.
― 7 min ler
A estabilidade na agrupamento garante que os grupos sejam eficazes e significativos.
― 7 min ler
GRANDE usa gradiente descendente pra melhorar o aprendizado a partir de dados tabulares.
― 5 min ler
Um novo método pra avaliar modelos de IA através de embeddings e meta características.
― 7 min ler
Um novo método revela padrões em decisões legais usando análise de texto automatizada.
― 9 min ler
Um modelo pra ter qualidade de foto consistente em diferentes smartphones.
― 9 min ler
Apresentar alternativas pode aumentar a satisfação do usuário em sistemas de recomendação de moda.
― 7 min ler
Um novo conjunto de dados avalia as habilidades de modelos de linguagem na resolução de problemas de matemática avançada.
― 6 min ler
Analisando os efeitos da duplicação de código entre conjuntos de dados nas métricas de desempenho do modelo.
― 9 min ler
Esse estudo foca em melhorar os métodos de geração aumentada por recuperação para o português brasileiro.
― 7 min ler
Esse estudo apresenta o WAVES, um benchmark pra avaliar técnicas de marca d'água contra vários ataques.
― 5 min ler
O Orion-14B manda muito bem em entender e gerar texto multilíngue com 14 bilhões de parâmetros.
― 7 min ler
Novos métodos avaliam como os sistemas de diálogo mantêm a consistência da personalidade.
― 8 min ler
Esse framework melhora a forma como o conhecimento é combinado em modelos de machine learning pra ter um desempenho melhor.
― 8 min ler
Estudo revela que modelos de linguagem podem gerar impressões úteis de laudos PET.
― 7 min ler
Avaliando a precisão dos LLMs em diagnosticar condições médicas a partir de imagens e sintomas.
― 5 min ler
Essa pesquisa melhora a avaliação de relatórios de radiologia gerados por IA com a colaboração de especialistas.
― 10 min ler
Analisando como o red-teaming pode melhorar a segurança da IA e lidar com riscos potenciais.
― 9 min ler
Analisando a amplificação de danos em modelos de texto para imagem e seu impacto na sociedade.
― 7 min ler
Esse artigo fala sobre ajustar modelos de linguagem pra alinhar com os valores e expectativas humanas.
― 7 min ler
Um novo modelo de linguagem aberto pra pesquisa e inovação em processamento de linguagem natural.
― 7 min ler
Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.
― 8 min ler
EvaLLM oferece uma abordagem estruturada pra avaliar conteúdo visual gerado por IA.
― 7 min ler
Um método pra verificar modelos de aprendizado de máquina pra aumentar a confiança e a transparência.
― 7 min ler
O SIDU-TXT esclarece as decisões de IA no processamento de linguagem natural.
― 7 min ler
Pesquisas mostram que mulheres enfrentam preconceitos nas avaliações e no financiamento na academia.
― 12 min ler
Um novo método transforma anotações manuscritas em tinta digital pra facilitar o uso.
― 8 min ler
Uma análise dos problemas de reprodutibilidade na pesquisa de previsão de falhas em software de aprendizado profundo.
― 10 min ler
Novo método melhora a verificação de fatos para textos gerados por computador com nomes ambíguos.
― 8 min ler
Aprenda a criar pôsteres que transmitam mensagens de forma clara e atraente.
― 6 min ler
Explorando os desafios e soluções do hackeamento de recompensas no treinamento de modelos de IA.
― 8 min ler
Um jeito novo de avaliar como os modelos respondem a perguntas relacionadas a imagens.
― 6 min ler
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler
Novos métodos melhoram como a gente avalia o texto gerado por computador.
― 10 min ler
Um olhar detalhado sobre a avaliação da CyberMetric de especialistas em IA e humanos em cibersegurança.
― 10 min ler