Este artigo fala sobre a justiça na escolha de candidatos para instituições em meio a avaliações tendenciosas.
L. Elisa Celis, Amit Kumar, Nisheeth K. Vishnoi
― 9 min ler
Ciência de ponta explicada de forma simples
Este artigo fala sobre a justiça na escolha de candidatos para instituições em meio a avaliações tendenciosas.
L. Elisa Celis, Amit Kumar, Nisheeth K. Vishnoi
― 9 min ler
Forester simplifica o aprendizado de máquina para usuários de R com um pacote fácil de usar.
Hubert Ruczyński, Anna Kozak
― 7 min ler
Novos métodos melhoram o realismo dos reflexos em espelhos em imagens geradas por computador.
Ankit Dhiman, Manan Shah, Rishubh Parihar
― 6 min ler
Um estudo sobre como agentes de IA seguem regras definidas pelos usuários usando o conjunto de dados ACS.
Lior Madmoni, Amir Zait, Ilia Labzovsky
― 10 min ler
Este estudo avalia o quanto os modelos de linguagem ajudam programadores iniciantes com comentários de código.
Aysa Xuemo Fan, Arun Balajiee Lekshmi Narayanan, Mohammad Hassany
― 5 min ler
Avaliando o papel dos modelos de linguagem nos julgamentos de relevância para recuperação de informação.
Ian Soboroff
― 7 min ler
Uma nova métrica que melhora a avaliação da consistência factual em resumos automáticos.
Yuxuan Ye, Edwin Simpson, Raul Santos Rodriguez
― 6 min ler
Uma nova abordagem melhora os resumos das sessões de saúde mental através de um motor de planejamento.
Aseem Srivastava, Smriti Joshi, Tanmoy Chakraborty
― 9 min ler
O RAGProbe automatiza a avaliação de sistemas RAG, melhorando seu desempenho e confiabilidade.
Shangeetha Sivasothy, Scott Barnett, Stefanus Kurniawan
― 7 min ler
Essa pesquisa apresenta métodos automáticos para avaliar a pulverização precisa na agricultura.
Harry Rogers, Tahmina Zebin, Grzegorz Cielniak
― 7 min ler
Melhorando avaliações através da Teoria da Resposta ao Item para um aprendizado de língua mais eficaz.
Jue Hou, Anisia Katinskaia, Anh-Duc Vu
― 9 min ler
Um novo padrão avalia quão bem modelos de IA imitam a linguagem humana.
Xufeng Duan, Bei Xiao, Xuemei Tang
― 6 min ler
Um novo método melhora a precisão ao responder perguntas de tabelas ao combinar dois sistemas.
Siyue Zhang, Anh Tuan Luu, Chen Zhao
― 9 min ler
Um novo método para criar distrações interessantes em avaliações educacionais.
Devrim Cavusoglu, Secil Sen, Ulas Sert
― 6 min ler
Um novo método pretende melhorar o texto alternativo para ícones de aplicativos móveis, ajudando usuários com deficiência visual.
Sabrina Haque, Christoph Csallner
― 5 min ler
DREAMS simplifica o aprendizado profundo para dados de EEG, promovendo transparência e práticas éticas.
Rabindra Khadka, Pedro G Lind, Anis Yazidi
― 8 min ler
Uma olhada em avaliar a confiabilidade das explicações da IA através da sensibilidade adversarial.
Supriya Manna, Niladri Sett
― 8 min ler
Modelos recentes melhoram a capacidade da IA de gerar e entender vários tipos de mídia.
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo
― 6 min ler
O ARLBench facilita a sintonia de hiperparâmetros para aprendizado por reforço com ferramentas de benchmark eficientes.
Jannis Becktepe, Julian Dierkes, Carolin Benjamins
― 9 min ler
Um modelo pra avaliar a qualidade da segmentação sem referências de verdade.
Ahjol Senbi, Tianyu Huang, Fei Lyu
― 10 min ler
Um jeito de gerenciar dados de sensores que se contradizem em veículos autônomos pra aumentar a segurança.
Oliver Schumann, Thomas Wodtko, Michael Buchholz
― 6 min ler
O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.
Jiatong Shi, Jinchuan Tian, Yihan Wu
― 8 min ler
Um método de três etapas para compartilhar dados de forma segura, protegendo a privacidade.
Tung Sum Thomas Kwok, Chi-hua Wang, Guang Cheng
― 6 min ler
Novo benchmark aborda lacunas na avaliação de LLMs para tomada de decisão clínica.
Fenglin Liu, Z. Li, H. Zhou
― 8 min ler
Visualizar programas funcionais pode facilitar o processo de depuração para os programadores.
John Whitington, Tom Ridge
― 7 min ler
Explorando como a IA Generativa tá influenciando os processos de design de interação.
Marie Muehlhaus, Jürgen Steimle
― 5 min ler
Este estudo examina valores em textos humanos e gerados por IA pra uma melhor compreensão.
Scott E. Friedman, Noam Benkler, Drisana Mosaphir
― 3 min ler
NetworkCommons é uma nova ferramenta para estudar interações moleculares.
Victor Paton, Denes Türei, Olga Ivanova
― 8 min ler
Um novo framework melhora o raciocínio em modelos de linguagem com justificativas de qualidade.
Jaehyeok Lee, Keisuke Sakaguchi, JinYeong Bak
― 8 min ler
Um estudo compara modelos de IA na compreensão de relações espaciais.
Shang Hong Sim, Clarence Lee, Alvin Tan
― 7 min ler
Analisando as vulnerabilidades e defesas dos novos modelos de IA.
Yangyang Guo, Fangkai Jiao, Liqiang Nie
― 7 min ler
Analisando como os modelos conseguem detectar comentários tóxicos em diferentes dialetos de idiomas.
Fahim Faisal, Md Mushfiqur Rahman, Antonios Anastasopoulos
― 7 min ler
MTFusion combina imagens e texto pra criar modelos 3D avançados.
Yu Liu, Ruowei Wang, Jiaqi Li
― 6 min ler
Uma olhada nas admissões holísticas e seu impacto nos futuros médicos.
Andrew D. Bergemann, Stephen R. Smith, Joel A. Daboub
― 7 min ler
Um novo método para criar materiais realistas aumenta a flexibilidade para artistas e designers.
Chenliang Zhou, Zheyuan Hu, Alejandro Sztrajman
― 6 min ler
Uma nova abordagem lida com os preconceitos em modelos de imagem-texto de forma eficaz.
Haoyu Zhang, Yangyang Guo, Mohan Kankanhalli
― 7 min ler
Avaliando a eficácia dos modelos de linguagem em tarefas de programação com novos benchmarks.
Nidhish Shah, Zulkuf Genc, Dogu Araci
― 6 min ler
Entendendo como Grafos de Conhecimento podem reduzir informações falsas nas respostas da IA.
Ernests Lavrinovics, Russa Biswas, Johannes Bjerva
― 7 min ler
Uma nova maneiras de avaliar modelos de tomada de decisão de IA usando mapas de atribuição.
Lars Nieradzik, Henrike Stephani, Janis Keuper
― 8 min ler
Analisando como humanos e IA podem trabalhar juntos de forma eficaz.
Filip Ilievski, Barbara Hammer, Frank van Harmelen
― 11 min ler