Artigos mais recentes para Ajuste fino

Aprendizagem de máquinas Treinando Agentes em Ambientes 3D Complexos

Um estudo sobre como alinhar agentes em jogos 3D pra melhorar o comportamento.

2025-08-01T10:54:42+00:00 ― 7 min ler

Aprendizagem de máquinas Otimizando Embeddings de Texto com Treinamento Eficiente

Aprenda a treinar modelos para embeddings de texto de forma esperta e eficaz.

2025-08-01T10:38:54+00:00 ― 5 min ler

Computação e linguagem Avanços em Modelos de Linguagem Médica com Conjuntos de Dados UltraMedical

As coleções da UltraMedical melhoram modelos de linguagem médica e resolvem a falta de dados.

2025-08-01T07:05:36+00:00 ― 7 min ler

Aprendizagem de máquinas Avançando a Classificação de Dados Tabulares com LoCalPFN

Descubra como o LoCalPFN melhora o desempenho de transformadores em dados tabulares.

2025-08-01T00:46:24+00:00 ― 6 min ler

Computação e linguagem Métodos Eficientes de Ajuste Fino para Modelos Multimodais

Estudo revela técnicas eficazes pra melhorar modelos de linguagem grandes multimodais.

2025-08-01T00:14:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando Backbone Leves para Classificação de Imagens

Um estudo sobre a eficácia de vários modelos leves na classificação de imagens.

2025-07-31T17:08:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Visão-Linguagem com Conjuntos de Dados Gerados

Este estudo explora métodos pra melhorar modelos de visão-linguagem usando imagens geradas.

2025-07-31T14:38:06+00:00 ― 5 min ler

Computação e linguagem Melhorando Modelos de Linguagem para Conversas Melhoradas

Esse artigo fala sobre métodos pra melhorar a geração de diálogos em modelos de linguagem.

2025-07-31T00:09:06+00:00 ― 6 min ler

Computação e linguagem Avaliando a Segurança no Ajuste Fino de Modelos de Linguagem Grandes

Analisando os riscos e as medidas de segurança na adaptação de modelos de linguagem.

2025-07-30T05:03:36+00:00 ― 6 min ler

Computação e linguagem Avaliando Modelos de Linguagem Grandes em Tarefas de Programação por Exemplo

Um olhar sobre como os LLMs encaram desafios de programação por meio de exemplos.

2025-07-29T21:25:24+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços na Classificação de Dados Tabulares com ICL-Transformers

Uma nova abordagem pra classificar dados tabulares usando ICL-transformers tá mostrando resultados promissores.

2025-07-29T04:32:32+00:00 ― 6 min ler

Computação e linguagem O Desafio do Raciocínio Fiel em LLMs

Analisando a eficácia do raciocínio em modelos de linguagem grandes.

2025-07-28T12:30:24+00:00 ― 9 min ler

Computação e linguagem A Geometria do Espaço Latente em Modelos Transformer

Investigando como o espaço latente afeta o desempenho de modelos transformer em tarefas de linguagem.

2025-07-28T01:03:06+00:00 ― 8 min ler

Computação e linguagem A Ascensão das Notícias Sintéticas e os Desafios de Detecção

Analisando o impacto do conteúdo de notícias sintéticas e as dificuldades de detecção.

2025-07-28T00:23:36+00:00 ― 8 min ler

Aprendizagem de máquinas Riscos de Memorização em Aprendizado por Reforço com Feedback Humano

Analisando a memorização em modelos de conclusão de código e suas implicações de privacidade.

2025-07-27T19:07:36+00:00 ― 9 min ler

Computação e linguagem Aprimorando as Habilidades de Planejamento em Modelos de Linguagem

Esse artigo examina maneiras de melhorar as habilidades de planejamento em grandes modelos de linguagem.

2025-07-27T08:35:36+00:00 ― 8 min ler

Computação e linguagem Avaliando o Conhecimento em Modelos de Linguagem Sem Respostas Geradas

Um método pra avaliar o conhecimento do modelo através do processamento interno.

2025-07-27T05:26:00+00:00 ― 8 min ler

Computação e linguagem DetectBench: Um Novo Padrão para Detecção de Evidências em Modelos de Linguagem

O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.

2025-07-27T05:02:18+00:00 ― 6 min ler

Computação e linguagem Estabilizando o Fine-Tuning com Ensemble Atrasado

Um novo método pra melhorar a estabilidade e o desempenho do modelo em ambientes com poucos recursos.

2025-07-27T02:00:36+00:00 ― 7 min ler

Computação e linguagem O Impacto do Ajuste Fino na Memória Factual dos Modelos de Linguagem

Como o ajuste fino afeta a habilidade dos modelos de linguagem de lembrar fatos com precisão.

2025-07-26T12:34:48+00:00 ― 7 min ler

Aprendizagem de máquinas Aprimorando Modelos de Linguagem com Aprendizado de Prefixo e Atenção NTK

Avanços em ajustar modelos de linguagem usando técnicas inovadoras.

2025-07-26T01:47:00+00:00 ― 7 min ler

Computação e linguagem RankAdaptor: Uma Nova Fronteira na Compressão de Modelos

O RankAdaptor otimiza o fine-tuning para modelos de IA podados, melhorando o desempenho de forma eficiente.

2025-07-25T10:30:36+00:00 ― 9 min ler

Aprendizagem de máquinas Otimizando a Memória em Grandes Modelos de Aprendizado de Máquina

Métodos para reduzir o uso de memória durante o ajuste fino de modelos grandes.

2025-07-25T09:35:18+00:00 ― 6 min ler

Computação e linguagem Melhorando o reconhecimento de fala em chinês através da regularização de pinyin

Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.

2025-07-25T07:47:55+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando o Raciocínio em Modelos de Linguagem com Otimização de Preferências

Novos métodos aprimoram as habilidades de raciocínio em modelos de linguagem pra melhorar o desempenho nas tarefas.

2025-07-25T06:33:36+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando o Alinhamento em Modelos de Linguagem com WARP

Um novo método melhora a forma como os modelos de linguagem se alinham com os valores humanos.

2025-07-24T22:47:30+00:00 ― 7 min ler

Computação e linguagem Melhorando Modelos de Seguir Instruções com Instruções de Comprimento

Este estudo foca em melhorar as respostas do modelo visando requisitos de comprimento específicos.

2025-07-24T13:10:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Destilação de Conhecimento Eficiente para Dispositivos Inteligentes

Pesquisa sobre como melhorar a transferência de conhecimento em dispositivos inteligentes com recursos limitados.

2025-07-24T05:56:18+00:00 ― 7 min ler

Computação e linguagem Avaliação da Robustez de Recuperação em Modelos de Linguagem

Este estudo avalia quão bem os grandes modelos de linguagem utilizam informações externas.

2025-07-23T20:27:30+00:00 ― 7 min ler

Som Conjunto de Dados de Música Sintética Tem como Objetivo Melhorar a Classificação de Gêneros

O dataset GTZAN-synth usa música sintética pra melhorar os sistemas de tagueamento de música.

2025-07-23T17:44:30+00:00 ― 6 min ler

Computação Neural e Evolutiva Avanços em Redes Neurais de Espinhas para Processamento de Linguagem

Novo método melhora o desempenho de redes neurais spiking em tarefas de linguagem.

2025-07-23T09:47:36+00:00 ― 7 min ler

Aprendizagem de máquinas Avançando o Design Molecular Através de Técnicas Guiadas por Incerteza

Novos métodos melhoram o design molecular medindo a incerteza das previsões.

2025-07-22T13:59:52+00:00 ― 8 min ler

Criptografia e segurança Avançando o Processamento de Dados com Computação de Borda Móvel

Um novo sistema melhora o processamento de dados enquanto garante a privacidade do usuário e o uso eficiente dos recursos.

2025-07-22T09:34:00+00:00 ― 7 min ler

Computação e linguagem HyperLoader: Uma Nova Maneira de Treinar Modelos

O HyperLoader melhora o treinamento de modelos multitarefa usando técnicas inovadoras e hipernetworks.

2025-07-21T16:34:54+00:00 ― 7 min ler

Aprendizagem de máquinas Ameaças à Segurança dos Modelos de Linguagem Reveladas

Pesquisas mostram como é fácil remover as funções de segurança dos modelos Llama 3.

2025-07-21T15:23:48+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Capacidade do Modelo na Ajuste Fino

Uma nova estrutura melhora o desempenho de modelos grandes de forma eficiente durante o ajuste fino.

2025-07-21T14:04:48+00:00 ― 7 min ler

Aprendizagem de máquinas Ajuste Consistente de Proxy: Uma Nova Maneira para Modelos Black-box

CPT melhora a performance de modelos de caixa-preta sem acesso direto aos parâmetros internos.

2025-07-21T11:03:06+00:00 ― 7 min ler

Aprendizagem de máquinas Avanço do Ajuste Fino em Dispositivos para Modelos de Linguagem

Ajustando grandes modelos de linguagem diretamente nos smartphones enquanto protege os dados dos usuários.

2025-07-21T08:40:54+00:00 ― 7 min ler

Engenharia de software Melhorando a Geração de Código para Linguagens Específicas de Domínio

Analisando métodos pra melhorar a geração de código pra linguagens de programação especializadas usando LLMs.

2025-07-21T04:36:00+00:00 ― 8 min ler

Computação e linguagem Avançando Modelos de Linguagem Árabe com o Conjunto de Dados InstAr-500k

Novo conjunto de dados melhora o desempenho do modelo de linguagem árabe e ajuda na comunicação eficaz.

2025-07-20T16:05:30+00:00 ― 7 min ler