Artigos mais recentes para Treinamento de Modelo

Aprendizagem de máquinas EchoAlign: Um Novo Método para Rótulos Barulhentos em Aprendizado de Máquina

EchoAlign modifica as características dos dados pra alinhar com rótulos barulhentos, melhorando o desempenho de machine learning.

2025-08-09T12:59:18+00:00 ― 7 min ler

Aprendizagem de máquinas Transformers e Aprendizado por Diferença Temporal

Este artigo examina o uso de aprendizado TD em transformadores para aprendizado em contexto.

2025-08-09T00:44:36+00:00 ― 9 min ler

Aprendizagem de máquinas Configurando o Peso de Decaimento no AdamW para Deep Learning

Aprenda a ajustar a decaída de peso para melhorar o desempenho do modelo no AdamW.

2025-08-08T22:46:06+00:00 ― 8 min ler

Computação e linguagem Avanços nos Modelos de Linguagem 360Zhinao

Novos modelos de linguagem mostram potencial em entender e gerar a linguagem humana.

2025-08-08T18:49:06+00:00 ― 6 min ler

Aprendizagem de máquinas Usando Modelos de IA Fraca pra Treinar Uns Mais Fortes

Modelos fracos podem ajudar modelos de IA fortes a aprenderem de forma mais eficaz.

2025-08-08T14:44:12+00:00 ― 7 min ler

Aprendizagem de máquinas Melhorando a Eficiência de Aprendizado com Conjuntos de Dados Dinâmicos

Conjuntos de dados dinâmicos aumentam o aprendizado do modelo e reduzem as necessidades de recursos.

2025-08-08T07:53:24+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços no Treinamento de Redes Neurais Esparsas

Novo método smup melhora a eficiência no treinamento de redes neurais esparsas.

2025-08-07T18:35:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Aproveitando Modelos de Linguagem para Tarefas de Visão de Baixo Nível

Explorando o uso de LLMs pra melhorar tarefas de visão de baixo nível, tipo remoção de ruído e desfoque.

2025-08-07T08:03:30+00:00 ― 8 min ler

Computação e linguagem Avançando na Geração de Código para Melhorar o Raciocínio

Essa pesquisa foca em gerar pseudo-programas pra melhorar as tarefas de raciocínio nos modelos.

2025-08-07T05:17:36+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços em Meta-Aprendizado Sem Dados

Explorando a regularização de agrupamentos de tarefas para lidar com a heterogeneidade do modelo.

2025-08-06T19:09:18+00:00 ― 5 min ler

Aprendizagem de máquinas Acelerando o Treinamento de Modelos de Difusão

Um novo método reduz o tempo e o custo no treinamento de modelos de difusão.

2025-08-06T10:27:54+00:00 ― 9 min ler

Aprendizagem de máquinas Apresentando o FedHPL: Uma Nova Abordagem para Aprendizado Federado

FedHPL melhora a eficiência do aprendizado federado enquanto garante a privacidade dos dados entre os dispositivos.

2025-08-06T09:01:00+00:00 ― 5 min ler

Aprendizagem de máquinas Transferência Eficiente de Módulos LoRA Usando Dados Sintéticos

Um novo método permite a transferência de módulos LoRA com dados sintéticos, minimizando a dependência de dados originais.

2025-08-06T08:45:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Jump-Teaching: Lidando com Rótulos Barulhentos em Aprendizado de Máquina

Um novo método melhora o desempenho do modelo usando dados com rótulos ruidosos.

2025-08-06T07:26:12+00:00 ― 8 min ler

Aprendizagem de máquinas Repensando as Estratégias de Treinamento para Modelos Grandes

Explorando métodos de treinamento eficientes para grandes modelos de machine learning.

2025-08-05T21:33:42+00:00 ― 7 min ler

Aprendizagem de máquinas Impacto da Adaptação de Baixa Classificação na Retenção de Conhecimento em Aprendizado de Máquina

Analisando como o LoRA afeta a retenção de conhecimento em modelos pré-treinados durante o aprendizado contínuo.

2025-08-05T16:49:18+00:00 ― 8 min ler

Aprendizagem de máquinas Modelos com Senha: Revelando Habilidades Ocultas da IA

Um novo conceito de modelo mostra como testar as capacidades da IA de forma eficaz.

2025-08-05T08:15:48+00:00 ― 8 min ler

Aprendizagem de máquinas Entendendo Recursos Atípicos em Redes Neurais

Examinando os efeitos de características fora da curva no treinamento de redes neurais.

2025-08-05T06:01:30+00:00 ― 6 min ler

Computação e linguagem Busca Fraca-Para-Forte: Um Novo Jeito de Guiar Modelos de Linguagem Grandes

Este artigo detalha uma abordagem inovadora pra melhorar modelos de linguagem usando modelos menores.

2025-08-05T05:45:42+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Generalização do Modelo com Técnicas DISAM

Esse artigo fala sobre Minimização Consciente da Nitidez Inspirada no Domínio pra uma adaptação de modelo melhor.

2025-08-05T00:06:00+00:00 ― 5 min ler

Computação e linguagem Alinhando Modelos de Linguagem com Preferências de Grupos

Um novo método tem como objetivo lidar com o viés nas saídas de modelos de linguagem.

2025-08-04T18:02:36+00:00 ― 8 min ler

Computação e linguagem Melhorando Modelos de Recompensa com Críticas Sintéticas

Um novo método melhora os modelos de recompensa usando críticas sintéticas pra um alinhamento melhor.

2025-08-03T23:12:54+00:00 ― 14 min ler

Aprendizagem de máquinas Reavaliando o Aprendizado de IA: Influência e Lógica

Analisando como a IA aprende com os dados, dá pra ver que tem lacunas grandes na lógica e no raciocínio.

2025-08-03T18:12:42+00:00 ― 7 min ler

Computação e linguagem Skywork-MoE: Avanços em Modelagem de Linguagem

Skywork-MoE melhora o processamento de linguagem com técnicas eficientes e uma arquitetura inovadora.

2025-08-03T15:18:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando o Treinamento Adversarial: Uma Nova Abordagem

Apresentando o PART, um método pra aumentar a precisão e a robustez dos modelos de aprendizado de máquina.

2025-08-03T10:58:12+00:00 ― 6 min ler

Aprendizagem de máquinas Ajuste Fino Eficiente em Modelos Generativos

DEFT melhora modelos de difusão pra amostragem condicional eficaz com poucos recursos.

2025-08-03T06:45:24+00:00 ― 8 min ler

Computação e linguagem Avaliando as Habilidades de Raciocínio dos Modelos de Linguagem

Esse estudo analisa como os LLMs lidam com raciocínio em cenários abstratos e contextuais.

2025-08-02T16:24:18+00:00 ― 6 min ler

Criptografia e segurança Melhorando a Privacidade em Aprendizado de Máquina com DPDR

Um novo método melhora a proteção da privacidade enquanto treina modelos de aprendizado profundo.

2025-08-02T15:29:00+00:00 ― 6 min ler

Aprendizagem de máquinas Repensando o Crescimento de Modelos no Treinamento de IA

Esse artigo apresenta uma nova abordagem pra melhorar a eficiência do treinamento de modelos de linguagem.

2025-08-02T13:22:36+00:00 ― 5 min ler

Aprendizagem de máquinas Uma Nova Abordagem para Medir a Nitidez em Modelos de ML

Apresentando uma estrutura universal para medidas de nitidez em aprendizado de máquina.

2025-08-02T04:49:06+00:00 ― 6 min ler

Aprendizagem de máquinas Medindo a Memorização em Modelos de Linguagem

Um novo método revela como os modelos de linguagem lembram dos dados de treinamento.

2025-08-01T14:04:18+00:00 ― 9 min ler

Aprendizagem de máquinas Otimizando Embeddings de Texto com Treinamento Eficiente

Aprenda a treinar modelos para embeddings de texto de forma esperta e eficaz.

2025-08-01T10:38:54+00:00 ― 5 min ler

Aprendizagem de máquinas Aprimorando o Treinamento de Modelos com Dados Aumentados Contrafactualmente

O PairCFR melhora modelos de treinamento usando dados contrafactuais pra ter um desempenho melhor.

2025-07-31T12:00:06+00:00 ― 9 min ler

Aprendizagem de máquinas Avanços no Treinamento Adversarial com o ProFeAT

Apresentando o ProFeAT pra aumentar a robustez do modelo contra ataques adversariais.

2025-07-31T09:14:12+00:00 ― 7 min ler

Aprendizagem de máquinas Repensando o Treinamento de Modelos: O Papel do Esquecimento na Generalização

Esse artigo fala sobre como os modelos podem esquecer preconceitos pra melhorar as previsões.

2025-07-31T03:18:42+00:00 ― 6 min ler

Aprendizagem automática Aprendizado em Contexto em Transformers: Principais Insights

Um estudo que revela os fatores que influenciam o aprendizado em contexto nos Transformers.

2025-07-31T02:26:12+00:00 ― 8 min ler

Aprendizagem de máquinas Método de Fisher Empírico Aprimorado para Descenso do Gradiente Natural

Um novo método melhora o Fisher Empírico para otimizar melhor os modelos.

2025-07-31T00:40:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Ensino Adaptativo na Destilação de Conhecimento

Um jeito de melhorar os modelos dos alunos usando insights de modelos de professores mais fortes.

2025-07-30T00:11:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Personalizando Modelos Generativos com Espaço de Pesos

Personalizando modelos generativos pra refletir identidades únicas através do espaço de pesos.

2025-07-29T12:04:30+00:00 ― 8 min ler

Aprendizagem de máquinas A Importância das Soft Labels na Destilação de Dados

Analisando como rótulos suaves melhoram o aprendizado de máquina através da destilação de conjuntos de dados.

2025-07-29T01:40:24+00:00 ― 7 min ler