Um modelo pra ter qualidade de foto consistente em diferentes smartphones.
― 9 min ler
Ciência de ponta explicada de forma simples
Um modelo pra ter qualidade de foto consistente em diferentes smartphones.
― 9 min ler
Apresentar alternativas pode aumentar a satisfação do usuário em sistemas de recomendação de moda.
― 7 min ler
Um novo conjunto de dados avalia as habilidades de modelos de linguagem na resolução de problemas de matemática avançada.
― 6 min ler
Analisando os efeitos da duplicação de código entre conjuntos de dados nas métricas de desempenho do modelo.
― 9 min ler
Esse estudo foca em melhorar os métodos de geração aumentada por recuperação para o português brasileiro.
― 7 min ler
Esse estudo apresenta o WAVES, um benchmark pra avaliar técnicas de marca d'água contra vários ataques.
― 5 min ler
O Orion-14B manda muito bem em entender e gerar texto multilíngue com 14 bilhões de parâmetros.
― 7 min ler
Novos métodos avaliam como os sistemas de diálogo mantêm a consistência da personalidade.
― 8 min ler
Esse framework melhora a forma como o conhecimento é combinado em modelos de machine learning pra ter um desempenho melhor.
― 8 min ler
Estudo revela que modelos de linguagem podem gerar impressões úteis de laudos PET.
― 7 min ler
Avaliando a precisão dos LLMs em diagnosticar condições médicas a partir de imagens e sintomas.
― 5 min ler
Essa pesquisa melhora a avaliação de relatórios de radiologia gerados por IA com a colaboração de especialistas.
― 10 min ler
Analisando como o red-teaming pode melhorar a segurança da IA e lidar com riscos potenciais.
― 9 min ler
Analisando a amplificação de danos em modelos de texto para imagem e seu impacto na sociedade.
― 7 min ler
Esse artigo fala sobre ajustar modelos de linguagem pra alinhar com os valores e expectativas humanas.
― 7 min ler
Um novo modelo de linguagem aberto pra pesquisa e inovação em processamento de linguagem natural.
― 7 min ler
Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.
― 8 min ler
EvaLLM oferece uma abordagem estruturada pra avaliar conteúdo visual gerado por IA.
― 7 min ler
Um método pra verificar modelos de aprendizado de máquina pra aumentar a confiança e a transparência.
― 7 min ler
O SIDU-TXT esclarece as decisões de IA no processamento de linguagem natural.
― 7 min ler
Pesquisas mostram que mulheres enfrentam preconceitos nas avaliações e no financiamento na academia.
― 12 min ler
Um novo método transforma anotações manuscritas em tinta digital pra facilitar o uso.
― 8 min ler
Uma análise dos problemas de reprodutibilidade na pesquisa de previsão de falhas em software de aprendizado profundo.
― 10 min ler
Novo método melhora a verificação de fatos para textos gerados por computador com nomes ambíguos.
― 8 min ler
Aprenda a criar pôsteres que transmitam mensagens de forma clara e atraente.
― 6 min ler
Explorando os desafios e soluções do hackeamento de recompensas no treinamento de modelos de IA.
― 8 min ler
Um jeito novo de avaliar como os modelos respondem a perguntas relacionadas a imagens.
― 6 min ler
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler
Novos métodos melhoram como a gente avalia o texto gerado por computador.
― 10 min ler
Um olhar detalhado sobre a avaliação da CyberMetric de especialistas em IA e humanos em cibersegurança.
― 10 min ler
Abordando preocupações éticas através da remoção seletiva de memória em modelos de IA.
― 7 min ler
Explorando como máquinas criam imagens a partir de textos e se alinham com as preferências humanas.
― 6 min ler
Esse estudo analisa os benefícios das respostas personalizadas em modelos de linguagem.
― 5 min ler
Uma nova maneira de avaliar e comparar algoritmos de RecSys usando conjuntos de dados diversos.
― 19 min ler
Uma nova estrutura pra avaliar a correção das respostas da IA com um julgamento parecido com o humano.
― 8 min ler
Modelos de linguagem têm como objetivo melhorar o aprendizado de ciências, oferecendo ajuda personalizada.
― 10 min ler
Uma ferramenta de referência pra melhorar métodos de detecção de anomalias em séries temporais.
― 8 min ler
Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.
― 7 min ler
Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.
― 9 min ler
Um novo framework avalia como os LLMs raciocinam pra responder perguntas complexas.
― 5 min ler