Artigos mais recentes para Ativações

Computação e linguagem RoLoRA: Melhorando o Ajuste Fino para Grandes Modelos de Linguagem

Um novo método que melhora o desempenho do modelo através de uma gestão eficaz de outliers.

2025-07-16T02:24:48+00:00 ― 7 min ler

Criptografia e segurança Abordando Rowhammer na Segurança do DRAM

Explorando novas maneiras de melhorar a segurança do DRAM contra ameaças do Rowhammer.

2025-07-14T03:16:36+00:00 ― 6 min ler

Aprendizagem de máquinas JumpReLU SAEs: Uma Nova Abordagem para Autoencoders Esparsos

JumpReLU SAEs melhoram a representação dos dados mantendo tudo simples e claro.

2025-07-10T09:44:36+00:00 ― 8 min ler

Criptografia e segurança Enfrentando a ameaça do Rowhammer com MINT

A MINT oferece uma forma econômica de lidar com o problema do Rowhammer na DRAM.

2025-07-09T05:41:54+00:00 ― 5 min ler

Inteligência Artificial Melhorando a Extração de Conhecimento de Modelos de Linguagem

Um novo método aumenta a precisão de sondar modelos de linguagem para conhecimento.

2025-07-06T10:01:18+00:00 ― 7 min ler

Biologia de sistemas Equilibrando a Atividade Gênica e o Crescimento Celular

Estudo revela interação entre a expressão gênica e taxas de crescimento em células engenheiradas.

2025-07-03T07:51:49+00:00 ― 8 min ler

Métodos Quantitativos Entendendo a Dinâmica da Coagulação do Sangue

Explorando como as plaquetas interagem e formam coágulos no corpo.

2025-07-03T01:36:33+00:00 ― 6 min ler

Neurociência Avanços nas Técnicas de Estimulação do Nervo Vago

Novos métodos melhoram a eficácia dos tratamentos do nervo vago.

2025-06-28T09:09:47+00:00 ― 7 min ler

Computação e linguagem Mistura Heterogênea de Especialistas: Uma Nova Abordagem

Uma olhada no modelo HMoE e suas vantagens no processamento de linguagem.

2025-06-24T22:58:12+00:00 ― 9 min ler

Aprendizagem de máquinas Aprimorando a Análise de Séries Temporais com Explicações Contrafactuais

Explore como métodos interativos melhoram a transparência dos modelos na análise de séries temporais.

2025-06-24T21:39:12+00:00 ― 6 min ler

Imunologia Reavaliando a Especificidade do TCR: Novas Ideias

Uma nova visão sobre a especificidade do TCR desafia os métodos mais antigos.

2025-06-23T12:16:29+00:00 ― 6 min ler

Computação e linguagem Melhorando Modelos de Linguagem para Dispositivos Móveis

Um novo método torna o uso de modelos de linguagem grandes em dispositivos móveis mais eficiente.

2025-06-22T14:21:12+00:00 ― 13 min ler

Aprendizagem de máquinas Escalonamento Logit: Uma Nova Abordagem para Detecção de OOD

O Logit Scaling melhora a detecção de dados fora da distribuição sem precisar de dados de treino.

2025-06-18T10:17:12+00:00 ― 7 min ler

Processamento de Áudio e Fala Insights sobre Neurônios em Modelos de Fala

Pesquisas mostram como os neurônios em modelos de fala reconhecem características-chave do som.

2025-06-17T11:17:25+00:00 ― 8 min ler

Neurociência Novas Descobertas sobre a Regulação do Fluxo Sanguíneo no Cérebro

Um estudo mostra como os vasos sanguíneos reagem à atividade dos neurônios no cérebro.

2025-06-12T01:16:12+00:00 ― 7 min ler

Computação e linguagem Novo Método Melhora Edição de Ativação em Modelos de Linguagem

A Pseudo-Rotação de Householder melhora o desempenho e a consistência das respostas dos modelos de linguagem.

2025-06-11T02:46:30+00:00 ― 8 min ler

Aprendizagem de máquinas Tratando de Problemas de Memória em Redes Neurais Profundas

Essa pesquisa explora métodos de redução de memória para treinar redes neurais profundas.

2025-06-09T21:32:42+00:00 ― 7 min ler

Aprendizagem de máquinas Aperfeiçoando Modelos de Linguagem: O Futuro das Técnicas de Poda

Uma nova forma de deixar os modelos de linguagem mais leves sem perder desempenho.

2025-05-25T17:03:45+00:00 ― 9 min ler

Aprendizagem de máquinas Entendendo Vetores de Direção e Autoencoders

Esse artigo fala sobre a relação entre vetores de direção e autoencoders esparsos em IA.

2025-05-24T09:05:24+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Interpretabilidade de Redes Neurais com Autoencoders Esparsos por Gradiente

Os Autoencoders Esparsos com Gradiente aumentam a influência das características pra uma melhor compreensão do modelo.

2025-05-22T15:32:51+00:00 ― 9 min ler

Arquitetura de Hardware Anda: Transformando a Precisão de Ativação em Modelos de Linguagem Grande

Saiba sobre o Anda, um novo método para gerenciar dados de ativação em LLMs.

2025-05-10T14:25:20+00:00 ― 7 min ler

Aprendizagem de máquinas Detectando Memorização em Modelos de Linguagem

Saiba como os pesquisadores identificam a memorização em modelos de linguagem grandes pra entender melhor.

2025-04-28T15:45:45+00:00 ― 9 min ler

Aprendizagem de máquinas Redes Neurais: Medindo Distâncias Sobre Intensidade

Novas descobertas sugerem que redes neurais se concentram mais em distâncias do que em intensidades de sinal.

2025-04-18T04:58:28+00:00 ― 6 min ler

Aprendizagem de máquinas Revolucionando as Redes Neurais Gráficas com CNA

O método CNA melhora os GNNs ao enfrentar o oversmoothing e aumentar o desempenho.

2025-04-10T07:47:33+00:00 ― 6 min ler

Inteligência Artificial Impulsionando o Raciocínio da IA com Cadeias de Pensamento

Explore como o Chain-of-Thought ajuda os modelos de IA a raciocinar melhor.

2025-04-09T16:32:42+00:00 ― 7 min ler

Computação e linguagem A Complexidade da Compreensão da Linguagem

Descubra as maneiras complexas que usamos pra entender a linguagem.

2025-03-24T13:44:24+00:00 ― 6 min ler

Biofísica O Sulco Cefálico: Uma Chave para o Desenvolvimento Embrionário

Descubra como as forças mecânicas moldam a vida desde o comecinho.

2025-01-29T00:05:00+00:00 ― 7 min ler

Neurónios e Cognição Decifrando o Papel do Cérebro na Fala

Pesquisadores estudam como nosso cérebro controla a fala e as implicações disso para a recuperação.

2025-01-18T05:35:46+00:00 ― 7 min ler