Artigos mais recentes para Otimização de Modelo

Visão computacional e reconhecimento de padrões Melhorando a Generalização em Modelos de Visão-Linguagem com OGEN

OGEN melhora a habilidade dos modelos de visão-linguagem de reconhecer novas classes de forma eficaz.

2025-09-13T12:21:48+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando Modelos de Linguagem Grande para Uso Mais Amplo

Esse artigo fala sobre técnicas pra melhorar a eficiência e o desempenho dos Modelos de Linguagem Grande.

2025-09-12T03:58:24+00:00 ― 9 min ler

Aprendizagem de máquinas Aumentando a Eficiência em Modelos de Linguagem com Decodificação Especulativa

Um método pra acelerar modelos de linguagem grandes sem perder a qualidade da saída.

2025-09-12T02:47:18+00:00 ― 7 min ler

Aprendizagem de máquinas DE-BERT: Uma Nova Abordagem para Saídas Antecipadas em Modelos de Linguagem

Apresentando o DE-BERT, um framework que melhora a eficiência em modelos de linguagem através de estratégias de saída antecipada.

2025-09-11T23:06:06+00:00 ― 8 min ler

Computação e linguagem Identificando Bilhetes Vencedores em Modelos de Linguagem Multilíngues

Um método pra ajustar modelos de linguagem usando menos parâmetros.

2025-09-10T23:08:18+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços em Técnicas de Quantização para Modelos de Aprendizado de Máquina

Aprenda como novas técnicas melhoram a eficiência de grandes modelos de aprendizado de máquina.

2025-09-10T13:31:36+00:00 ― 4 min ler

Computação e linguagem Um Novo Método para Afinação de Prompt Eficiente

Apresentando o BMTPT pra melhorar a sintonia de prompts em modelos de linguagem.

2025-09-08T14:55:00+00:00 ― 6 min ler

Computação e linguagem Novo Método SLEB Melhora a Eficiência de Grandes Modelos de Linguagem

O SLEB simplifica os LLMs removendo blocos de transformador redundantes, melhorando a velocidade e a eficiência.

2025-09-07T23:54:24+00:00 ― 7 min ler

Computação e linguagem LoRETTA: Um Novo Método para Ajustar Modelos de Linguagem

LoRETTA melhora a eficiência de ajuste fino para grandes modelos de linguagem com menos parâmetros.

2025-09-07T03:29:54+00:00 ― 7 min ler

Computação e linguagem Reduzindo a Necessidade de Memória em Modelos de Linguagem

Uma nova abordagem pra deixar modelos de linguagem menores e mais rápidos usando quantização de 1 bit.

2025-09-07T02:26:42+00:00 ― 8 min ler

Computação e linguagem Melhorando a Aprendizagem em Contexto com Análise de Influência

Um novo método de seleção de demonstrações melhora o desempenho do modelo em tarefas de linguagem.

2025-09-06T21:02:48+00:00 ― 9 min ler

Aprendizagem de máquinas Simplificando a Alinhamento de IA com REINFORCE e RLOO

Novos métodos prometem melhorar o desempenho dos modelos de IA através de um aprendizado por reforço mais simples.

2025-09-05T04:29:36+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Eficiência em Modelos de Linguagem Grandes

Novo método de quantização melhora o desempenho de modelos de linguagem grandes enquanto reduz o tamanho.

2025-09-04T18:21:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando Métodos de Quantização para Modelos de Aprendizado Profundo

Novas técnicas melhoram a quantização enquanto lidam com outliers pra um desempenho melhor do modelo.

2025-09-04T10:03:36+00:00 ― 6 min ler

Aprendizagem de máquinas Ajuste Fino de Modelos Grandes com Adaptação de Baixa Classificação

Um estudo sobre métodos eficientes para ajustar modelos grandes através da Adaptação de Baixa Classificação.

2025-09-04T03:44:24+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Geração de Imagens a partir de Descrições em Texto

Um novo método melhora a precisão da geração de imagens usando modelos de visão e linguagem.

2025-09-03T22:44:12+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços nas Técnicas de Meta-Aprendizado por Reforço

Explorando novas maneiras de melhorar a tomada de decisões em agentes de aprendizado.

2025-09-01T03:03:36+00:00 ― 9 min ler

Aprendizagem automática Conectando Planicidade e Generalização em Aprendizado de Máquina

Pesquisas mostram como mínimos planos estão relacionados a um desempenho melhor do modelo em dados não vistos.

2025-08-31T11:56:24+00:00 ― 6 min ler

Computação e linguagem PipeRAG: Melhorando a Geração Aumentada por Recuperação

Um novo método pra deixar o RAG mais rápido e melhorar a qualidade.

2025-08-31T07:26:30+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando a Generalização de Domínio com UDIM

Uma nova abordagem melhora o desempenho do modelo em diferentes tipos de dados.

2025-08-29T23:58:24+00:00 ― 8 min ler

Aprendizagem de máquinas Equilibrando Eficiência e Robustez em Modelos de Aprendizado Profundo

Investigando métodos de compressão de modelos pra melhorar a eficiência e as defesas contra ataques.

2025-08-29T09:53:06+00:00 ― 8 min ler

Aprendizagem de máquinas Aprimorando a Eficiência do Aprendizado Federado com o FedMef

O FedMef melhora o aprendizado federado para dispositivos com poucos recursos através de técnicas de poda inovadoras.

2025-08-27T06:24:12+00:00 ― 7 min ler

Aprendizagem de máquinas Aprimorando o Aprendizado de Máquina com MetaOptimize

MetaOptimize melhora o desempenho do modelo ajustando as configurações de aprendizado de forma dinâmica.

2025-08-25T12:07:32+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços no Ajuste Fino de Modelos de Aprendizado de Máquina

Apresentando um novo método para um ajuste fino de modelo mais eficiente.

2025-08-25T05:08:04+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Otimizando Redes Neurais Convolucionais com Poda por Aprendizado por Reforço

Um novo método usa aprendizado por reforço pra podar CNNs enquanto tá treinando.

2025-08-24T16:15:24+00:00 ― 9 min ler

Aprendizagem de máquinas Melhorando a Eficiência em Redes Neurais de Baixa Precisão

Este artigo fala sobre os custos e melhorias para redes neurais de baixa precisão.

2025-08-24T09:16:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando Métodos de Adaptação para Aprendizado de Máquina

A Adaptação de Difusão Generalizada melhora o desempenho do modelo com amostras fora da distribuição.

2025-08-24T09:08:48+00:00 ― 8 min ler

Aprendizagem de máquinas Enfrentando Dados Incompletos com Autoencoders Variacionais

Estratégias para melhorar autoencoders variacionais no manuseio de conjuntos de dados incompletos.

2025-08-23T21:11:48+00:00 ― 6 min ler

Computação e linguagem Cirurgião Cerebral Multilíngue: Uma Nova Abordagem para Compressão de Modelos

Um método pra melhorar o desempenho do modelo de linguagem em várias línguas durante a compressão.

2025-08-21T23:52:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Uma Nova Abordagem para Podar Modelos de Visão-Linguagem

Apresentando um método para poda de modelos complexos que não depende da tarefa.

2025-08-21T10:34:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando MLLMs com Prompting Visual Transferível

Um novo método melhora modelos multimodais usando prompts visuais compartilhados.

2025-08-18T16:04:54+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Apresentando a Destilação de Conhecimento Contrastiva

Um novo método pra melhorar o desempenho de modelos em IA através da transferência de conhecimento.

2025-08-17T10:27:24+00:00 ― 5 min ler

Computação e linguagem Simplificando a Seleção de Tarefas para Ajuste de Instruções

Um novo método, InsTa, melhora a seleção de tarefas na afinação de instruções.

2025-08-16T09:10:36+00:00 ― 9 min ler

Aprendizagem de máquinas Avaliando Modelos de Linguagem Grande: Tamanho e Precisão Importam

Esse estudo avalia como o tamanho do modelo e a quantização impactam o desempenho do modelo de linguagem.

2025-08-13T18:22:18+00:00 ― 8 min ler

Aprendizagem de máquinas Otimizando Modelos de Linguagem Grandes com Formato de Ponto Flutuante Estudante

Novas técnicas melhoram a eficiência e a precisão em grandes modelos de linguagem.

2025-08-13T15:36:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Geração de Imagens com Condicionamento LoRA

Melhorando modelos de difusão adicionando LoRA às camadas de atenção pra ter imagens melhores.

2025-08-13T14:56:54+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Design de Modelo Eficiente com Escalonamento de Modelo Diferenciável

Um novo método pra melhorar as estruturas de modelos de forma mais eficaz e eficiente.

2025-08-11T15:56:36+00:00 ― 7 min ler

Criptografia e segurança Abordando Riscos de Segurança em Modelos de Aprendizado Profundo Quantizados

Este artigo apresenta o EFRAP, uma defesa contra ataques de backdoor condicionados à quantização em modelos de aprendizado profundo.

2025-08-09T11:32:24+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando o Fine-Tuning com Adaptação Espectral

Um novo método melhora o ajuste fino de modelos grandes usando informações espectrais.

2025-08-09T02:35:12+00:00 ― 6 min ler

Aprendizagem de máquinas Adaptação Eficiente de Grandes Modelos de IA

Um método que combina adaptações de baixo rank e ortogonais para modelos de IA.

2025-08-07T20:57:42+00:00 ― 6 min ler