Saiba sobre o Anda, um novo método para gerenciar dados de ativação em LLMs.
Chao Fang, Man Shi, Robin Geens
― 7 min ler
Ciência de ponta explicada de forma simples
Saiba sobre o Anda, um novo método para gerenciar dados de ativação em LLMs.
Chao Fang, Man Shi, Robin Geens
― 7 min ler
LoRA-Mini reduz a complexidade enquanto mantém o desempenho do modelo lá em cima.
Ayush Singh, Rajdeep Aher, Shivank Garg
― 6 min ler
Aprenda como Modelos de Mistura Gaussiana melhoram o desempenho de GNN através da augmentação de dados.
Yassine Abbahaddou, Fragkiskos D. Malliaros, Johannes F. Lutzeyer
― 7 min ler
Descubra como a autoetiquetagem pode melhorar o desempenho de números de ponto flutuante na programação.
Olivier Melançon, Manuel Serrano, Marc Feeley
― 7 min ler
Explorando a transição de métodos de I/O bloqueantes para assíncronos.
Constantin Pestka, Marcus Paradies, Matthias Pohl
― 7 min ler
Como a quantização de bits baixos afeta grandes modelos de linguagem durante o treinamento.
Xu Ouyang, Tao Ge, Thomas Hartvigsen
― 7 min ler
Novas técnicas ajudam robôs a se adaptarem a diferentes condições de iluminação durante as tarefas.
Travis Davies, Jiahuan Yan, Xiang Chen
― 9 min ler
O DOGE simplifica a interação com documentos, deixando a informação mais acessível e fácil de entender.
Yinan Zhou, Yuxin Chen, Haokun Lin
― 7 min ler
Descubra como a IA móvel tá evoluindo com os modelos de Mistura de Especialistas.
Andrii Skliar, Ties van Rozendaal, Romain Lepert
― 6 min ler
Pesquisadores encontram maneiras eficazes de remover conhecimento indesejado de modelos de linguagem.
Haomin Zhuang, Yihua Zhang, Kehan Guo
― 5 min ler
Este estudo analisa os sinais do cérebro durante atividades cognitivas desafiadoras.
Runhao Lu, N. Dermody, J. Duncan
― 6 min ler
CXL oferece velocidade, mas enfrenta desafios com os sistemas existentes.
Shunyu Mao, Jiajun Luo, Yixin Li
― 8 min ler
Examinamos dois cenários para desenvolver ferramentas de segurança contra ataques.
Samuele Pasini, Jinhan Kim, Tommaso Aiello
― 7 min ler
Nova método melhora o aprendizado dos modelos de linguagem através da seleção organizada de exemplos.
Duc Anh Vu, Nguyen Tran Cong Duy, Xiaobao Wu
― 12 min ler
Um estudo sobre a precisão do PREDICT Breast v3 para diferentes resultados em pacientes.
Yi-Wen Hsiao, Gordon C. Wishart, Paul D.P. Pharaoh
― 7 min ler
Novos métodos melhoram a forma como encontramos imagens a partir de descrições de texto.
Muhammad Huzaifa, Yova Kementchedjhieva
― 6 min ler
Explorando os benefícios e desafios dos modelos híbridos em processamento de linguagem.
Rui Pan, Zhuang Wang, Zhen Jia
― 6 min ler
A tecnologia de IA traz nova eficiência para avaliações de saúde do coração com o PanEcho.
Gregory Holste, Evangelos K. Oikonomou, Zhangyang Wang
― 8 min ler
Um novo modelo de autoatenção facilita muito a compreensão de linguagem.
Md Kowsher, Nusrat Jahan Prottasha, Chun-Nam Yu
― 5 min ler
Um estudo sobre as tendências de evasão e os fatores que afetam a retenção de alunos.
Alessandra Ragni, Chiara Masci, Anna Maria Paganoni
― 6 min ler
Explorando o modelo ATTUNE para melhorar as interações entre humanos e robôs.
Giannis Petousakis, Angelo Cangelosi, Rustam Stolkin
― 6 min ler
Descobrindo métodos de ajuste fino eficientes pra deixar modelos de linguagem AI mais inteligentes.
Kaustubh Ponkshe, Raghav Singhal, Eduard Gorbunov
― 6 min ler
Descubra como o ROSE melhora a seleção de dados pra treinar modelos de linguagem melhor.
Yang Wu, Huayi Zhang, Yizheng Jiao
― 6 min ler
O ModPrompt ajuda detetores de objetos a se adaptarem a novas imagens de forma eficaz.
Heitor R. Medeiros, Atif Belal, Srikanth Muralidharan
― 7 min ler
Entendendo os preconceitos de dados em machine learning pra detectar cyberbullying de forma eficaz.
Andrew Root, Liam Jakubowski, Mounika Vanamala
― 9 min ler
Novo treinamento de áudio melhora o desempenho e a versatilidade do agente do Minecraft.
Nicholas Lenzen, Amogh Raut, Andrew Melnik
― 7 min ler
Uma olhada mais de perto nos algoritmos de otimização abertos e sua adaptabilidade.
Jaap Eising, Florian Dörfler
― 7 min ler
Descubra como as ferramentas de IA estão mudando a experiência de aprendizado dos alunos e o sucesso acadêmico.
Ben Ward, Deepshikha Bhati, Fnu Neha
― 8 min ler
Novo método encontra objetos em vídeos longos sem precisar de muito treino.
Savya Khosla, Sethuraman T, Alexander Schwing
― 8 min ler
Aprenda como o sandbagging afeta as avaliações de IA e maneiras de detectá-lo.
Cameron Tice, Philipp Alexander Kreer, Nathan Helm-Burger
― 7 min ler
Pesquisadores desenvolveram um método pra diminuir o preconceito nos modelos de linguagem usando modelos menores de especialistas.
Schrasing Tong, Eliott Zemour, Rawisara Lohanimit
― 9 min ler
FastRM melhora a transparência da IA, deixando as decisões das máquinas mais claras e rápidas.
Gabriela Ben-Melech Stan, Estelle Aflalo, Man Luo
― 7 min ler
Como o pré-processamento de dados impacta modelos de deep learning que analisam sinais de EEG.
Federico Del Pup, Andrea Zanola, Louis Fabrice Tshimanga
― 7 min ler
Descubra o impacto da GSQ na tokenização de imagens e na qualidade.
Jiangtao Wang, Zhen Qin, Yifan Zhang
― 8 min ler
Pesquisadores estão melhorando o desempenho dos LLMs enquanto economizam recursos.
Da Ma, Lu Chen, Situo Zhang
― 8 min ler
Revolucionando a maneira como consultamos logs com modelos ajustados.
Vishwanath Seshagiri, Siddharth Balyan, Vaastav Anand
― 6 min ler
Descubra como a correspondência semântica melhora o reconhecimento de imagens e as aplicações tecnológicas.
Frank Fundel, Johannes Schusterbauer, Vincent Tao Hu
― 6 min ler
Aprende como a seleção de exemplos inteligentes melhora o raciocínio em modelos de linguagem.
Mathurin Videau, Alessandro Leite, Marc Schoenauer
― 7 min ler
Transforme modelos descartados em novas soluções poderosas através da fusão de modelos.
Muhammad Khalifa, Yi-Chern Tan, Arash Ahmadian
― 8 min ler
O Marco-LLM conecta diferentes línguas, facilitando a comunicação pra geral.
Lingfeng Ming, Bo Zeng, Chenyang Lyu
― 5 min ler